본문 바로가기
[IT정보] 쉽게 알아보는 IT

파이썬(Python) 머신러닝 책을 구입하기 전에 확인해야 할 사항!

by 포써니 2020. 11. 15.
728x90

오늘은 날씨가 많이 따듯하고 공기도 좋았던 것 같습니다. 

 

오늘의 포스팅 시작합니다. 

 

 

파이썬(Python) 머신러닝에 관한 책이 너무 많아서 선택이 점점 어려워지고 있습니다. 우리는 새로운 경력을 쌓을 수 있는 무언가를 배우기 위해 시간과 돈을 투자하고 있습니다. 700페이지 분량의 머신러닝 책을 구입하여 중간까지 읽어 보면서 나에게 맞지 않는 책이라는 것을 깨닫는 것은 실망스러울 것입니다. 

 

파이썬(Python) 머신러닝에 관한 많은 책을 읽고 검토한 결과 모든 책이 그 자체로 고유하다는 것을 알 수 있습니다. 제목이 비슷한 책이 너무 많아서 특히 머신러닝 공부를 시작하는 경우 선택이 혼란스러울 수 있습니다.

 

다음은 파이썬(Python) 머신러닝 책을 구매하기 전에 더 잘 평가하는데 도움이 되는 세 가지입니다.

 

전제 조건

프로그래밍에 관한 모든 책에는 저자가 책에 의도된 독자를 설명하는 서문 또는 소개 섹션이 있습니다. 이 부분의 제목은 일반적으로 '전제조건"또는 "이 책을 읽어야 하는 사람"입니다. 서점에 있다면 책을 집어 들고 섹션으로 넘어가서 확인해보세요. 온라인으로 구매하는 경우  Amazon 및 기타 온라인 상점에서 필수 조건 섹션을 포함하여 책의 처음 몇 페이지를 볼 수 있습니다. 

 

다음은 전제 조건 섹션에서 살펴볼만한 몇 가지 사항입니다. 

 

파이썬(Python) 기술 : 일부 책은 개념을 증명하기 위해 간단한 코드 발췌하는 반면 다른 책은 목록 이해 , 슬라이싱, 문장, 매개변수, 언패킹, 등과 같은 고급 파이썬(Python) 기능을 사용합니다. 이 책이 사용할 모든 기술의 포괄적인 목록을 만들 것으로 기대하는 것은 무리가 있을 수 있지만 최소한 필요한 기술 수준을 언급해야 합니다. (대부분의 머신러닝 서적은 데이터 과학과 파이썬(Python)에 대한 기본적인 이해가 있다고 가능합니다. )

 

파이썬(Python) 라이브러리 : 파이썬(Python) 머신러닝 서적은 일반적으로 Scikitlearn을 사용하여 알고리즘을 구현합니다. 딥 러닝에 관한 책은 Tensor Flow, Keras 및  PyTorch를 다룹니다. 그러나 이 책은 Numpy, Pandas 및 Matplotlib와 같은 과학 라이브러리를 사용하여 데이터를 로드하고 조작합니다. 일부 책은 이러한 라이브러리를 다루고 다른 책은 이미 경험이 있어야 한다고 가정합니다. (사실은, 도서관에는 수백 페이지에 걸친 전공책이 있습니다.)

 

 파이썬(Python) 도구 : 대부분의 파이썬(Python) 머신러닝 개발자는 한 곳에서 알고리즘을 코딩하고 테스트하고 결과를 HTML 형식으로 저장할 수 있는 웹 기반 인터페이스인 주피터 노트북(Jupyter Notebook)을 선호합니다. 책에서 주피터를 사용하는 경우 설치 및 설정 과정이 있는 서적이 좋습니다.

 

▶수학 기술 : 머신러닝의 내부에는 많은 선형 대수, 미적분 및 통계가 포함됩니다. 일부 책은 개념적 설명고 ㅏ그림을 통해 러신 모닝 알고리즘의 메커니즘을 설명하려고 합니다. 대다수의 책에서는 다른 언급이 없어 수학적 방정식을 스스로 알아내야 합니다. (그리고 일부 책은 알고리즘에 대한 단계별 설명으로 둘 사이의 간격을 메우려고 할 것입니다.) 대부분의 책은 책을 읽는 데 필요한 수학 능력을 알려줍니다.

 

 

책에 설명이 정확하게 나와있지 않아도 걱정하지 마세요. 알아낼 다른 방법이 있습니다.

 

목차를 보자

목차를 살펴보면 머신러닝 및 파이썬 라이브러리의 다양한 영역에서 얼마나 깊이 들어가는지 알 수 있습니다. 대부분의 온라인 서점에서는 책을 구매하기 전에 목차를 볼 수 있습니다. 목차는 전제 조건 섹션에 책을 읽기 전에 알아야 할 사항이 명시적으로 명시되어 있지 않은 경우 일부 공백을 채우는데 도움이 됩니다.

 

다음은 목차에서 확인해야 할 몇 가지 사항입니다.

 

베이식 : 머신러닝에 관한 모든 책은 기초부터 시작합니다. 고급 책은 이 부분을 훑어보고 단일 장으로 요약하는 경향이 있습니다. 초급 도서는 일반적으로 머신러닝, 수학, 데이터, 사전처리 및 데이터 유형, 머신러닝 파이프 라인의 기본 사항을 설명하기 위해 여러 페이지를 사용합니다. 

 

▶ 알고리즘 : 초급 도서는 일반적으로 알고리즘이 속하는 범주 (회귀, 분류, 클러스터링) 및 고수준 개념 ( 지도 학습 대 비지도 학습, 앙상블 학습, 하이퍼 파라미터 튜닝, 차원 감소) 측면에서 알고리즘을 논의합니다. 고급 책에는 일반적으로 특정 유형의 알고리즘 (지원 벡터 머신, 의사 결정 트리, 주요 구성 요소 분석, 다양한 클러스터링 방법 등)에 대한 보다 세부적인 장이 있습니다.

 

▶ 파이썬 라이브러리 : 고급 및 중급 책에서는 NumPy 및 Matplotlib와 같은 파이썬 라이브러리에 대해 설명하지 않습니다. 초급 도서에는 이러한 라이브러리를 사용하여 데이터를 로드, 조작 및 시각화하는 방법을 설명하는 섹션이 있습니다. 

 

▶ 프로젝트 : 이 책이 파이썬 머신러닝에 대한 첫 번째 책인 경우 엔드-투-엔드 머신러닝 프로젝트 또는 머신러닝을 다른 애플리케이션에 통합하는 예를 보여주는 장을 찾으세요. 이 실습적이고 실용적인 장에서는 머신러닝이 일반적인 소프트웨어 개발 라이프 사이클에 어떻게 적합한 지에 대한 아이디어를 제공합니다. 예를 들어, Scikit-Learn, Keras 및 Tensor Flow를 사용한 Hands-On Machine Learning : 개념, 도구 및 기술을 통한 지능형 시스템 구축, 2nd Edition에는 진행하기 전에 매우 실용적인 예제와 함께 전체 기계 학습 파이프 라인을 안내하는 장이 있습니다. 알고리즘 유형의 핵심으로 확인합니다. 

 

▶ 추가사항 : 마지막 장과 부록을 살펴보세요. 여기에서 수학 및 파이썬 복습, 클라우드 호스팅 서비스 사용, Hadoop 및 Apache Spark와 같은 빅 데이터 플랫폼 소개 등 책에서 제공해야 하는 고유한 보석 중 일부를 찾을 수 있습니다. 클라우드 플랫폼과 빅 데이터 저장소를 사용하면 완전한 교육 볼륨이 있지만 이 책에서 제공하는 지식을 통해 머신 러닝 탐색에서 다음에 살펴볼 방향을 알 수 있습니다. 

 

코드 저장소

표지로 기계 학습 책을 판단할 수는 없지만 제 경험상 코드 샘플은 책의 품질과 대상 독자에 대해 많은 것을 알려줍니다. 대부분의 파이썬 머신러닝 학습 서적에는 코드 샘플에 액세스 할 수 있는 GitHub 저장소가 함께 제공됩니다. 저장소 주소는 일반적으로 책의 소개 부분에 기록되어 있지만 GitHub와 합께 책 제목을 검색하여 찾을 수도 있습니다.

 

책의 공식 GitHub는 일반적으로 책의 저자 또는 발행인의 프로필에 따라 제출됩니다. 가짜 리포지토리에 도달하지 않도록 하세요. 

 

파이썬 머신러닝 서적의 GitHub 저장소는 구조가 다릅니다. 일반적으로 각 장의 노트북 및 코드 샘플을 위한 하나의 폴더와 데이터 세트 및 이미지와 같은 자산에 대한 별도의 폴더가 표시되어야 합니다.

 

 

Chqpter 폴더 중 하나를 열고 내용을 ㄹ확인합니다. 다음은 코드의 품질을 결정할 수 있는 몇 가지 사항입니다.

 

▶ 형식 : 책이 주피터 노트북 형식 또는 일반 파이썬 코드 파일로 샘플을 제공하는지? 주피터 노트북은 훨씬 더 풍부한 경험을 제공합니다. 코드를 실행하지 않더라도 작성자가 업로드하기 전에 실행한 경우 실험 결과를 보여줍니다.

 

▶ 세부 정보 : 주피터는 코드가 아닌 정보를 추가할 수도 있습니다. 좋은 책은 일반적으로 주피터의 기능을 사용하여 설정 지침, 자막 및 각 코드 블록을 책의 해당 위치와 연관시키는데 도움이 되는 기타 정보와 같은 세부 정보를 추가합니다.

 

▶ 설명 : 책의 코드 샘플에 대해 자세히 설명할 수는 없지만 실험의 기본 단계를 보여주는 최소한의 설명이 있어야 합니다. 대부분의 코드 파일에는 간결함을 위해 책에서 생략된 행도 포함되어 있습니다. 좋은 책은 일반적으로 주석에 이러한 섹션을 표시합니다.

 

 

 

마지막으로 

파이썬 러닝 머신의 마스터로 만들어줄 서적은 없습니다. 하지만 위의 팁들로 여러분의 시간과 돈을 절약하고 머신러닝을 배우는데 도움이 되기를 바랍니다.

 

반응형

댓글