본문 바로가기

분류 전체보기

(262)
워드 임베딩과 텍스트 벡터화 차이점 텍스트 벡터화와 워드 임베딩 차이점 워드 임베딩과 텍스트 벡터화의 차이점보다 횟수 기반 임베딩과 예측 기반 임베딩 차이점으로 봐주시면 감사하겠습니다. 텍스트 벡터화는 단순히 단어가 출현한 빈도를 고려하는 방법이고 워드 임베딩은 단어들 간의 의미를 고려해 예측하면서 단어를 벡터로 만드는 차이점을 가지고 있습니다. 텍스트 벡터화 Vectorization? 텍스트를 수치형 텐서로 변환하는 과정 자연어 처리(NLP : Natural Language Processing)에서 주로 사용 특징을 추출하는 방법 중 하나임 입력 데이터를 원시 형식(텍스트)에서 머신럴닝 모델이 지원하는 형식인 실수 벡터로 변환하는 방식에 대한 전문 용어 텍스트 벡터화 방식 희소 표현 방식(Sparse Representation) 밀집 표..
[Book] 5. 모델 평가와 성능 향상 - (2) Book Title : Introduction to Machine Learning with Python - 파이썬 라이브러리를 활용한 머신러닝 - 지은이 : 안드레아스 뮐러, 세라 가이도 옮긴이 : 박해선 출판사 : 한빛미디어 코드 출처 https://github.com/rickiepark/introduction_to_ml_with_python GitHub - rickiepark/introduction_to_ml_with_python: 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다. Contribute to rickiepark/introduction_to_ml_with_python development by..
[Study] 신입 자라기 - 15 신입 자라기 15일 차 - 휴무 Task Logging 출근에서 휴무로 변경되어 집에서 휴식 회사 근처 헬스장 등록 프로그래머스 레벨 2 문제 하나 풀기 사이킷런 교차검증 공부 내일은 벡터화와 워드 임베딩에 대해 공부 및 정리
[Book] 5. 모델 평가와 성능 향상 - (1) Book Title : Introduction to Machine Learning with Python - 파이썬 라이브러리를 활용한 머신러닝 - 지은이 : 안드레아스 뮐러, 세라 가이도 옮긴이 : 박해선 출판사 : 한빛미디어 코드 출처 https://github.com/rickiepark/introduction_to_ml_with_python GitHub - rickiepark/introduction_to_ml_with_python: 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다. Contribute to rickiepark/introduction_to_ml_with_python development by..
[Book] 4. 비지도학습과 데이터 전처리 - (2) Book Title : Introduction to Machine Learning with Python - 파이썬 라이브러리를 활용한 머신러닝 - 지은이 : 안드레아스 뮐러, 세라 가이도 옮긴이 : 박해선 출판사 : 한빛미디어 코드 출처 https://github.com/rickiepark/introduction_to_ml_with_python GitHub - rickiepark/introduction_to_ml_with_python: 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다. Contribute to rickiepark/introduction_to_ml_with_python development by..
[Study] 신입 자라기 - 14 신입 자라기 14일 차 Task Logging 연속형, 범주형, 텍스트형 데이터를 null값 클렌징 방식을 기존 방식을 참고해서 처리함. 텍스트형 데이터 인코딩 방식 고민 Vectorization? 입력 데이터를 원시 형식에서 머신러닝 모델이 지원하는 형식인 실수 벡터로 변환하는 방식에 대한 전문 용어 자연어 처리(NLP : Natural Language Processing)에서 주로 사용 특징을 추출하는 방법 중 하나 자세한 건 더 공부 후 포스팅 출근길에 보는 CS RAM(Random Access Memory) 데이터 읽기 쓰기 모두 가능 휘발성으로서 종료 시 내용 삭제 DRAM(Dynamic RAM) , SRAM(Static)이 있음 ROM(Read Only Memory) 데이터 읽기만 가능 PRO..
[Book] 4. 비지도학습과 데이터 전처리 - (1) Book Title : Introduction to Machine Learning with Python - 파이썬 라이브러리를 활용한 머신러닝 - 지은이 : 안드레아스 뮐러, 세라 가이도 옮긴이 : 박해선 출판사 : 한빛미디어 코드 출처 https://github.com/rickiepark/introduction_to_ml_with_python GitHub - rickiepark/introduction_to_ml_with_python: 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다. Contribute to rickiepark/introduction_to_ml_with_python development by..
[Study] 신입 자라기 - 13 신입 자라기 13일 차 Task Logging API 가이드 수정 범주형 데이터 인코딩 및 전처리 Study df[’col’].ndim 차원 반환 pandas에서 dtype ‘O’는 object df[’col’].hasnas 속성 값에 nan 있으면 True Series.mask df.mask(df > 5, other = -1) : 5 보다 크면 1 df.where(df> 5 , other =-1) : 5보다 큰 것들은 내버려두고 나머지 1 출근길에 보는 CS 하이퍼 바이저 가상 머신 모니터 가상 머신을 생성하고 구동하는 소프트웨어 CPU /GPU 차이 CPU 중앙 처리 장치 순차 작업에 좋음 GPU 영상을 처리하는 용도로 나옴 대량 연산을 병렬적으로 수행해서 CPU보다 빠름 GPU 가속 컴퓨팅은 ML/..