본문 바로가기

데이터 Story/데이터 상념(想念)

[번역글] 데이터 과학자(Data Scientist)란?

데이터 과학자에 대해 조금이나마 알 수 있는 글입니다.

데이터 모델러와는 완전 다르네요. ㅎ


원문: https://www.sas.com/en_us/insights/analytics/what-is-a-data-scientist.html#


--


데이터 과학자는 복잡한 문제를 해결할 있는 기술적 능력을 갖추고 있고, 해결돼야 문제를 찾는 호기심이 있는 새로운 유형의 분석 데이터 전문가다.

 

그들은 수학자이고, 컴퓨터 과학자이자 유행에 민감한 사람이다. 그리고 비즈니스와 IT 세계를 아우르고 있기 때문에 수요가 많고 급여가 높다. 누가 데이터 과학자가 되고 싶지 않겠는가?

그들은 시대의 상징과 같다. 데이터 과학자들은 10년 전에 많은 관심을 끌지 못했지만, 갑작스런 인기는 기업이 현재 빅데이터에 대해 어떻게 생각하고 있는지를 반영한다. 이처럼 다루기 힘든 대량의 구조화되지 않은 정보는 이상 무시되거나 잊혀지지 않는다. 이전에는 누구도 예상하지 못했던 비즈니스 통찰력을 발굴하는 사람이 있는 , 이런 정보는 매출 증대에 도움이 되는 가상의 금광이다. 데이터 과학자가 되라.

 

데이터 과학자는 어디에서 왔는가?

 

많은 데이터 과학자들은 통계학자나 데이터 분석가로서 경력을 쌓기 시작했다. 그러나 빅데이터(하둡과 같은 빅데이터 저장 처리 기술) 성장하고 발전하기 시작하자 이러한 역할도 발전했다. 데이터는 이상 IT 부서에서 처리할 있는 부가적인 것이 아니다. 데이터는 분석, 창조적 호기심 하이테크 아이디어에 대한 재능을 수익 창출을 위해 새로운 방식으로 전환하는 핵심 정보다.

데이터 과학자 역할 또한 학문적 기원을 가지고 있다. , 대학은 고용주가 협업을 하는 프로그래머를 원한다는 것을 인식하기 시작했다. 교수들은 노스캐롤라이나 주립 대학교(North Carolina State University) 고급분석연구원(Institute for Advanced Analytics) 같은 프로그램을 통해서 차세대 데이터 과학자들을 대량 생산할 준비를 했다. 현재 전국의 대학에는 60 이상의 유사한 프로그램이 있다.

 

데이터 과학자의 전형적인 업무

 

데이터 과학자 역할에 관한 명확한 업무 설명은 없다. 그러나 그들은 아래와 같은 가지 작업을 수행할 것이다.

 

- 많은 양의 비정형 데이터를 수집하여 보다 유용한 형식으로 변환한다.

- 데이터 기반 기술을 사용하여 비즈니스 관련 문제를 해결한다.

- SAS, R Python 포함한 다양한 프로그래밍 언어로 작업한다.

- 통계 검증 배포를 포함한 통계에 대해 확실히 이해하고 있다.

- 기계 학습(machine learning), 러닝(deep learning) 텍스트 분석(text analytics) 같은 분석 기법을 기반으로 한다.

- IT 비즈니스와 협력해서 커뮤니케이션한다.

- 비즈니스의 핵심을 도울 있는 추세를 알아내는 것뿐만 아니라 데이터 내에서 주문 패턴을 조사한다.

 

데이터 과학자의 연장통에는 무엇이 있는가?

 

아래와 같은 용어나 기술은 데이터 과학자가 일반적으로 사용한다.

 

- 데이터 시각화(Data visualization): 데이터를 그림이나 그래픽 형식으로 표현하면 데이터를 쉽게 분석할 있다.

- 기계 학습(Machine learning): 수학 알고리즘 자동화를 기반으로 인공 지능의 분야다.

- 러닝(Deep learning): 복잡한 추상화를 모델링하기 위해 데이터를 사용하는 기계 학습 연구의 영역이다.

- 패턴 인식(Pattern recognition): 데이터의 패턴을 인식하는 기술이다(종종 기계 학습과 상호 교환 가능).

- 데이터 준비(Data preparation): 원시 데이터를 다른 형식으로 변환하여 보다 쉽게 사용할 있도록 하는 프로세스다.

- 텍스트 분석(Text analytics): 구조적 데이터를 검토하여 주요 비즈니스 통찰력을 수집하는 프로세스다.

 

어떻게 하면 데이터 과학자가 있나?

 

데이터 과학 분야의 경력을 쌓는 것이 현명한 방법이 있다. 이는 취업 기회가 풍부할 뿐만 아니라 실험 창의력의 여지가 있는 기술 분야에서 일할 있는 기회가 것이다. 그렇다면 어떤 전략이 있는가?

 

만약에 학생이라면, 데이터 과학 학위를 제공하는 대학을 선택하거나 데이터 과학 분석 분야에 최소한 하나의 과정을 제공하는 대학을 선택하는 것이 중요한 번째 단계다. 오클라호마 주립 대학, 앨라바마 대학, 케네사 주립 대학, 남부 감리교 대학, 노스 캐롤라이나 주립 대학 텍사스 A&M 데이터 과학 프로그램이 있는 학교다.

 

만약 직업을 바꾸고 싶은 전문가라면, 대부분의 데이터 과학자들은 데이터 분석가 또는 통계 전문가로서의 배경을 가지고 있지만, 다른 사람들은 비즈니스 또는 경제와 같은 비기술적인 분야에서 넘어온다. 어떻게 다양한 배경의 전문가가 같은 분야에 종사할 있나? 공통점이 무엇인지 살펴보는 것이 중요하다. 문제 해결의 요령, 의사소통을 잘하는 능력, 그리고 사물이 어떻게 작동하는지에 대한 끊임없는 호기심을 가진 사람들이다.

 

이러한 특성 이외에 아래에 대한 확실한 이해가 필요하다.

 

- 통계학 기계 학습

- SAS, R 또는 Python 같은 코딩 언어

- MySQL Postgres 같은 데이터베이스

- 데이터 시각화 보고 기술

- 하둡 맵리듀스

 

이러한 기술을 직접 배우고 싶지 않은 경우 온라인 코스 프로그램에 등록하라. 그리고 나서, 물론 네트워크를 구축해야 한다. 회사의 다른 데이터 과학자와 연결되거나 온라인 커뮤니티를 찾으라. 그들은 데이터 과학자들이 하는 일에 대한 정보와 가장 좋은 직장을 찾을 있는 곳을 알려줄 것이다.

 

기업은 언제 데이터 과학자를 고용할 준비를 하는가?

 

데이터 과학자 직책을 수락하기 전에 조직에 대한 가지 사항을 검토해야 한다.

 

- 대량의 데이터를 다루며, 해결해야 복잡한 문제가 있는가? 진정으로 데이터 과학자가 필요한 조직은 가지 공통점이 있다. 대용량의 데이터를 관리하며, 매일매일 중요한 문제에 직면한다. 그들은 일반적으로 금융, 정부 제약과 같은 산업에 종사하고 있다.

- 가치 있는 데이터인가? 회사의 문화는 데이터 과학자를 고용해야 하는지에 영향을 미친다. 분석을 지원하는 환경이 있는가? 경영진의 지원이 있는가? 그렇지 않다면 데이터 과학자에게 투자하는 것은 낭비가 것이다.

- 바꿀 준비가 됐나? 데이터 과학자로서, 당신은 진지하게 받아 들여지기를 기대하며, 그중 일부는 당신의 작업이 성취되는 것을 보게된다. 비즈니스가 보다 작동할 있는 방법을 찾는데 시간을 할애하라. 이에 대한 응답으로 비즈니스는 당신이 발견한 결과를 기꺼이 따를 준비가 되어 있어야 한다.

 

데이터를 기반으로 비즈니스 의사 결정을 이끄는 데이터 과학자를 고용하는 것은 일부 조직에는 맹신이 있다. 당신이 일하고 있는 비즈니스가 올바른 사고 방식을 가지고 있는지 확인하고 변화를 준비하라.

 

[원문]

What is a Data Scientist?

 

Data scientists are a new breed of analytical data expert who have the technical skills to solve complex problems – and the curiosity to explore what problems need to be solved.

 

They’re part mathematician, part computer scientist and part trend-spotter. And, because they straddle both the business and IT worlds, they’re highly sought-after and well-paid. Who wouldn’t want to be one?

They’re also a sign of the times. Data scientists weren’t on many radars a decade ago, but their sudden popularity reflects how businesses now think about 
big data. That unwieldy mass of unstructured information can no longer be ignored and forgotten. It’s a virtual gold mine that helps boost revenue – as long as there’s someone who digs in and unearths business insights that no one thought to look for before. Enter the data scientist.

 

Where did they come from?

 

Many data scientists began their careers as statisticians or data analysts. But as big data (and big data storage and processing technologies such as Hadoop) began to grow and evolve, those roles evolved as well. Data is no longer just an afterthought for IT to handle. It’s key information that requires analysis, creative curiosity and a knack for translating high-tech ideas into new ways to turn a profit.

The data scientist role also has academic origins. A few years ago, universities began to recognize that employers wanted people who were programmers and team players. Professors tweaked their classes to accommodate this – and some programs, such as the Institute for Advanced Analytics at North Carolina State University, prepared to churn out the next generation of data scientists. There are now more than 60 similar programs in universities around the country.

 

* Typical job duties for data scientists

 

There's not a definitive job description when it comes to a data scientist role. But here are a few things you'll likely be doing:

 

-Collecting large amounts of unruly data and transforming it into a more usable format.

-Solving business-related problems using data-driven techniques.

-Working with a variety of programming languages, including SAS, R and Python.

-Having a solid grasp of statistics, including statistical tests and distributions.

-Staying on top of analytical techniques such as machine learning, deep learning and text analytics.

-Communicating and collaborating with both IT and business.

-Looking for order and patterns in data, as well as spotting trends that can help a business’s bottom line.

 

* What’s in a data scientist’s toolbox?

 

These terms and technologies are commonly used by data scientists:

 

-Data visualization: the presentation of data in a pictorial or graphical format so it can be easily analyzed.

-Machine learning: a branch of artificial intelligence based on mathematical algorithms and automation.

-Deep learning: an area of machine learning research that uses data to model complex abstractions.

-Pattern recognition: technology that recognizes patterns in data (often used interchangeably with machine learning).

-Data preparation: the process of converting raw data into another format so it can be more easily consumed.

-Text analytics: the process of examining unstructured data to glean key business insights.

 

How can you become a data scientist?

 

Positioning yourself for a career in data science could be a smart move. You’ll have plenty of job opportunities, plus it’s a chance to work in the technology field with room for experimentation and creativity. So what’s your strategy?

 

If you’re a student

Choosing a university that offers a data science degree – or at least one offering classes in data science and analytics – is an important first step. Oklahoma State University, University of Alabama, Kennesaw State University, Southern Methodist University, North Carolina State University and Texas A&M are all examples of schools with data science programs.

 

If you’re a professional who wants to shift careers

While most data scientists have backgrounds as data analysts or statisticians, others come from non-technical fields such as business or economics. How can professionals from such diverse backgrounds end up in the same field? It’s important to look at what they have in common: a knack for solving problems, the ability to communicate well and an insatiable curiosity about how things work.

 

Aside from those qualities, you’ll also need a solid understanding of:

 

-Statistics and machine learning.

-Coding languages such as SAS, R or Python.

-Databases such as MySQL and Postgres.

-Data visualization and reporting technologies.

-Hadoop and MapReduce.

 

If you don’t want to learn these skills on your own, take an online course or enroll in a bootcamp. And then, of course, you should network. Connect with other data scientists in your company, or find an online community. They’ll give you insider information into what data scientists do – and where you’ll find the best jobs.

 

 

When is a business ready to hire a data scientist?

 

Before you accept a data scientist position, there are a few things about the organization you should evaluate:

 

-Does it deal with large amounts of data and have complex issues that need to be solved? Organizations that truly need data scientists have two things in common: They manage massive amounts of data, and they face weighty issues on a day-to-day basis. They’re typically in industries such as finance, government and pharma.

-Does it value data? A company's culture has an impact on whether it should hire a data scientist. Does it have an environment that supports analytics? Does it have executive buy-in? If not, investing in a data scientist would be money down the drain.

-Is it ready to change? As a data scientist, you expect to be taken seriously, and part of that entails seeing your work come to fruition. You devote your time to finding ways your business can better function. In response, a business needs to be ready – and willing – to follow through with the results of your findings.

 

Hiring a data scientist to guide business decisions based on data can be a leap of faith for some organizations. Make sure the business you might be working for has the right mindset – and is ready to make some changes.