클래스: 데이터 과학 학습: 기본 이해

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,200개를 수강하세요.

통계 및 소프트웨어 사용

통계 및 소프트웨어 사용

데이터 과학은 여전히 실천에 의해 정의되고 있기 때문에 공통 소프트웨어 및 도구 사용에 대한 추가 강조가 있습니다. 데이터 과학자는 초기 고고학자와 같으므로 소프트웨어를 브러시와 곡괭이로 생각하면 발견해야 합니다. 모든 도구를 배우는 데 너무 집중하지 마세요. 도구 자체로는 당신을 데이터 과학자가 되게 하지 않습니다. 누군가를 데이터 과학자로 만드는 것은 도구가 아니라 과학적 방법입니다. 도구는 기본적으로 저장, 스크러빙 및 분석의 세 가지 범주로 나뉩니다. 데이터를 저장하기 위해 스프레드시트, 데이터베이스 및 키 값 저장소를 사용할 수 있습니다. 일부 인기 있는 것은 Hadoop, Cassandra 및 Postgres SQL입니다. 스크러빙은 데이터 작업을 쉽게 하기 위한 일반적인 방법입니다. 여기서는 텍스트 편집기, 스크립팅 도구, Python 및 Scala와 같은 프로그래밍 언어를 사용합니다. 마지막으로 데이터 분석에 도움이 되는 통계 패키지가 있습니다. 가장 인기 있는 것은 오픈 소스 패키지 R, SPSS 및 Python의 데이터 라이브러리입니다. 이러한 도구를 사용하면 데이터를 시각화하고 멋진 차트와 그래프를 만들 수도 있습니다. 먼저 데이터를 보유하기 위해 알아야 할 도구를 살펴봅시다. 많이 듣게 될 한 가지 용어는 빅 데이터의 도전입니다. 이들은 너무 커서 대부분의 데이터베이스 관리 시스템에 맞지 않는 데이터 세트입니다. 데이터 과학과 빅 데이터 사이의 연결은 너무 밀접해서 많은 사람들이 둘이 하나이고 같다고 생각합니다. 그러��� 데이터 과학은 과학적인 방법을 데이터에 적용하고 있다는 점을 기억하세요. 이것은 데이터가 커야 한다고 가정하지 않습니다. 실제로 스프레드시트만을 사용하여 데이터 과학 통계를 소개하는 Data Smart라는 훌륭한 책이 있습니다. 그럼에도 불구하고 데이터 과학에서 가장 활발한 분야 중 하나는 빅 데이터입니다. 오픈 소스 소프트웨어 Hadoop은 현재 가장 인기가 있습니다. Hadoop은 분산 파일 시스템을 사용하여 여러…

목차