실무자를 위한 파이썬 100제
오승환 지음 / 정보문화사 / 2020년 2월
평점 :
장바구니담기



파이썬을 시작하는데 입문용으로 도움이 된다. 파이썬 기초 문법을 마스터했다면, 이 책에서 소개하는 실무에서 사용하는 예제를 적용해 볼 수 있다. 데이터를 수집하고 정리하는 핵심 도구인 판다스, 데이터 시각화를 위한 맷플롯립, 통계처리와 머신러닝을 지원하는 사이킷런 등의 다양한 라이브러리를 다루면서 데이터 분석과 머신러닝의 폭을 확장할 수 있다. 


파이썬은 언어의 간결한 문법과 쉬운 이해도로 많은 사람들에게 주목받고 있다. 파이썬을 선택하는 것은 단순히 프로그래밍 언어를 배우는 것 이상의 의미를 갖는다. 이 책에서 소개하고 있는 100개의 예제 코드를 작성해 보면서 실무에서 활용 가능한 능력을 키울 수 있다. 


웹 스크래핑, 데이터 정리와 시각화, 오피스 자동화, 애플리케이션 개발까지의 프로세스를 구체적인 예제와 함께 제시하며, 직접 실습을 통해 실무에서 적용 가능한 예제를 확인해 볼 수 있다.


파이썬은 현재 빅데이터와 머신러닝 분야에서 주요 언어로 자리매김하고 있다. 파이썬의 다양한 활용법을 익힌다면, 업무 효율성을 향상시키고 데이터에 기반한 의사결정에 도움이 된다. 오픈 소스의 확대와 IT 분야에서의 프로그래밍과 AI에 결합된 결과로 발전하게 되었다.




댓글(0) 먼댓글(0) 좋아요(7)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
데이터사이언스를 위한 기초수학 with 파이썬 Learn IT
박민서 지음 / 길벗캠퍼스 / 2023년 1월
평점 :
장바구니담기


데이터 과학(Data Science)은 대규모의 데이터를 수집, 분석, 해석하고 이를 통해 통찰력을 얻는 학문이다. 데이 과학은 통계학, 컴퓨터 과학, 도메인 지식과 결합하여 데이터를 수집하고 정보를 추출한 뒤 문제의 본질을 파악해 의사결정과 문제 해결을 지원한다. 데이터 과학은 특정 도메인(예: 의학, 금융, 마케팅)에서 진행되기 때문에 해당 도메인에 대한 전문 지식이 필요하다.


1) 데이터 수집

데이터 과학의 첫 번째 단계는 데이터를 수집하는 것이다. 이 데이터는 다양한 출처에서 오며, 구조화된 데이터베이스, 비정형 텍스트 문서, 센서 데이터, 웹에서 스크랩한 데이터 등이 될 수 있다.


2) 데이터 전처리

수집한 데이터는 종종 노이즈, 결측값, 이상치를 포함하며, 전처리를 통해 데이터의 품질을 개선한다. 이 과정에는 데이터 정제, 변환, 스케일링 및 피처 엔지니어링이 포함된다.


3) 데이터 분석

데이터 과학자는 데이터를 분석하여 패턴, 관계, 통계적 특성을 발견한다. 이를 위해 통계 분석, 머신 러닝, 데이터 시각화 등 다양한 도구와 기술을 사용한다.


4) 예측 및 모델링

데이터 과학자는 데이터 분석을 기반으로 예측 모델을 구축한다. 이 모델은 문제 해결, 의사결정, 추천 시스템 등 다양한 응용 분야에 사용된다.


5) 결과 해석

모델을 사용하여 예측하거나 분석한 결과를 이해하고 해석한다. 비전문가에게도 설명 가능한 결과를 제공해야 한다.


6) 데이터 시각화

데이터를 시각화하여 인사이트를 시각적으로 전달하고 의사결정을 지원한다.


데이터 과학은 다양한 산업 및 분야에서 중요한 역할을 하며, 데이터 중심 의사결정과 문제 해결을 위한 핵심 도구 중 하나로 자리 잡았다. 데이터 과학은 계속해서 발전하며, 새로운 도구와 기술이 나타난다. 데이터 과학자는 지속적인 학습과 업데이트가 필요하다. 데이터 과학 작업은 데이터 처리, 알고리즘 구현, 대용량 데이터 처리 등의 컴퓨터 과학적 측면을 포함한다. 프로그래밍 언어(예: Python, R)와 데이터베이스 관리 기술을 갖추어야 한다.


데이터 과학은 수학적 원리와 통계를 활용하여 데이터를 분석하고 모델링 하는 학문이다. 이 책은 데이터 과학을 이해하고 수행하기 위한 기초 수학 개념을 설명한다. 지금까지 읽었던 기초수학을 설명한 책 중에서 설명이 가장 깔끔하고 이해하기가 쉬웠다. 미분, 벡터, 선형대수, 확률, 통계 등의 개념을 설명하는 흐름도 매끄럽고 논리적이다. 수학적 개념을 학습하기에 좋은 내용으로 구성되어 있다.


데이터 과학을 수행하려면 이러한 기초 수학 개념을 이해하고 그것을 실제 데이터 분석 및 모델링에 적용할 수 있어야 한다. 수학 및 소프트웨어를 사용하여 계산을 수행하고 데이터를 시각화하며, 프로그래밍 언어를 사용하여 수학적 개념을 구현할 수 있는 능력도 중요하다.


댓글(0) 먼댓글(0) 좋아요(5)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
Do it! 점프 투 장고 - 파이썬 웹 개발부터 배포까지! Do it! 시리즈
박응용 지음 / 이지스퍼블리싱 / 2021년 1월
평점 :
장바구니담기


책의 진행이 매끄러워서 좋다. 문제나 에러가 발생하더라고 그냥 코딩한다. 그리고 어떤 문제인지를 설명하고 왜 문제가 발생했는지 그것을 해결하기 위해 어떻게 해야 하는지 설명을 한다. 처음에는 그냥 문제없이 작업해 나가면 진행이 수월하지 않을까 했는데 책을 읽고 나니 지금의 진행이 학습하는데 보다 효율적이다.


Do it! 시리즈는 기술을 단기간에 학습하기에 좋다. 책의 설명을 따라가며 직접 코딩해 나가면 장고(Django)에 관해서 기본적인 내용을 학습할 수 있다. 아래와 같이 위키독스에서 전체 내용을 인터넷으로 볼 수도 있지만 종이책으로 구매해서 보는 것을 추천한다.


https://wikidocs.net/book/4223


댓글(0) 먼댓글(0) 좋아요(9)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
모두의 파이썬 - 20일 만에 배우는 프로그래밍 기초, 개정2판 모두의 시리즈
이승찬 지음 / 길벗 / 2018년 10월
평점 :
장바구니담기


중학교, 고등학교에서 파이썬 프로그래밍을 교육한다. 이 책은 초등학교 고학년과 중학교 학생이 쉽게 학습할 수게 집필했다. 학생 혼자서도 스스로 진행이 가능하도록 설명하고 있지만 부분적으로 어려워서 진도가 막히는 경우도 있다. 그럴 때는 코딩을 잘하는 다른 사람이나 컴퓨터를 할 수 있는 부모의 도움이 필요하다.


파이썬을 설치하고 거북이 그래픽 예제가 나온다. Python Turtle Graphics을 이용해 쉽고 재미있게 코딩을 배울 수 있게 하였다. 아무래도 학생들은 딱딱한 텍스트 출력보다는 움직이는 그림에 흥미를 둘 거 같다. 책의 절반 정도는 거북이로 그림 그리는 예제가 나온다.


초보자를 위해 친절하게 내용을 설명하고 있다. 하지만 DAY마다 에러 해결하기 부분은 너무 반복적인 내용으로 도배를 하고 있는 것 같다. 그냥 부록으로 모두 정리해도 될 거 같은데 각각의 DAY마다 나온다. 학생들을 위한 교재로는 괜찮은 거 같은데 파이썬을 입문하려는 사람에게는 그렇게 좋은 책이 아니다. 이 책으로 학습을 하여도 결국 다른 입문서를 찾아서 볼 거라 생각한다.


댓글(0) 먼댓글(0) 좋아요(8)
좋아요
북마크하기찜하기 thankstoThanksTo
 
 
 
Do it! 파이썬 생활 프로그래밍 - 웹 크롤링부터 데이터 분석까지 내 손으로 직접 만든다! Do it! 시리즈
김창현 지음 / 이지스퍼블리싱 / 2020년 7월
평점 :
구판절판


파이썬 코드는 읽기 쉽고 작성하기 어렵지 않아 비전공자도 쉽게 배울 수 있다. 일상 속에서 접할 수 있는 상황을 가정하여 초심자나 비전공자도 배울 수 있도록 설명하고 있다. 책 속에 11가지 프로젝트를 소개하고 있는데 프로젝트라기보다는 샘플이나 예제 수준 정도이다. 크게 어려운 내용은 없기 때문에 처음부터 단계별로 학습해 나간다면 파이썬에 대해, 파일처리하는 방법, 통계 데이터와 시각화 표현까지 가볍게 체험해 볼 수 있다.


파이썬으로 코딩하기 위한 기본적인 환경에 대해 소개하고 파이썬에 관한 기초적인 것을 학습한다. 구구단 만들기, 부가세 계산하기, 텍스트 파일을 처리하는 방법을 다룬다. 책 속에 진행되는 내용과 코드를 보면 실무에 사용되는 용도라기보다는 학습 목적을 둔 것 같다. CSV 파일로 데이터를 다루는데 아래와 같이 CSV 파일을 읽고 쓰는 모듈을 별도의 함수로 소개한다.


데이터 분석을 위해 넘파이(numpy), 판다스(pandas), 맷플롯립(matplotlib)에 관한 내용도 가볍게 다룬다. 넘파이는 배열을 다루는 도구로 숫자로 된 큰 배열 데이터를 다룰 때 편리하다. 판다스는 많이 사용하는 패키지로 테이블 형태의 데이터를 다루거나 통계분석을 할 때 사용한다. 맷플롯핍은 데이터로 시작화 자료를 만드는 패키지이다.


댓글(0) 먼댓글(0) 좋아요(9)
좋아요
북마크하기찜하기 thankstoThanksTo