분류 전체보기 (262) 썸네일형 리스트형 [Study] 신입 자라기 - 19 신입 자라기 19일 차 Task Logging 시간 Task 7 : 00 기상 7 : 20 ~ 8 : 20 회사근처 헬스장으로 이동 8 : 20 ~ 9 : 20 헬스 9 : 20 ~ 9 : 30 샤워 9 : 30 ~ 9 : 40 출근 시간 9 : 40 ~ 11 : 30 hash table을 사용해서 데이터 관리하는 로직 고민 및 메서드 작성 11 : 30 ~ 12 :30 점심 시간 1. 배민 12 : 30 ~ 18 : 00 data cleansing, preprocessing 메서드 작성 1. 각 모듈들이 너무 강하게 연결되어있는 문제 2. 예외 처리 문제 18 : 00 ~ 18 : 50 저녁 시간 18 : 50 ~ 20 : 20 쿠버네티스 도큐먼트 읽기 - 네임스페이스 20 : 20 ~ 21 : 20 .. [쿠도읽] 쿠버네티스 네임스페이스? namespace? - (6) 쿠도읽 : 쿠버네티스 도큐먼트 읽기 네임스페이스? 단일 클러스터 내에서 리소스 그룹 격리 메커니즘 제공 리소스의 이름은 네임스페이스 내에서 유일해야 함, 네임스페이스 간에서 유일할 필요 X 네임스페이스는 여러 개의 팀, 많은 사용자가 있는 환경에서 사용하도록 만들어짐 네임 스페이스는 클러스터 자원을 여러 사용자 사이에서 나누는 방법 kubectl get namespace 네임스페이스 조회하기 초기 4개의 네임스페이스를 가짐 default : 기본 네임스페이스 kube-system : K8s 시스템에서 생성한 오브젝트를 위한 네임스페이스 kube-public : 자동으로 생성, 모든 사용자가 읽기 권한으로 접근 가느ㅏㅇ kube-node-lease : pass [쿠도읽] 오브젝트 이름? ID? UID? -(5) 쿠도읽 : 쿠버네티스 도큐먼트 읽기 오브젝트 이름? ID? UID? 클러스터의 각 오브젝트는 고유한 이름과 UID를 가짐 예시로 이름이 A인 pod는 동일한 namespace 내 하나만 존재하지만, 이름이 A인 pod와 deployment는 각각 존재 가능 namespace : 단일 클러스터 내에서 리소스 그룹 격리 메커니즘 제공 namespace ? 격리? : 오브젝트를 별도 그룹으로 분리 후 특정 namespace의 리소스에 대해서만 작업할 수 있음 이름 리소스 URL에서 오브젝트를 가리키는 문자열 같은 종류 내에서는 하나의 이름은 하나의 오브젝트에만 지정 가능 이름 제한 조건 : https://kubernetes.io/ko/docs/concepts/overview/working-with-object.. [Book] 6. 알고리즘 체인과 파이프라인 - (2) Book Title : Introduction to Machine Learning with Python - 파이썬 라이브러리를 활용한 머신러닝 - 지은이 : 안드레아스 뮐러, 세라 가이도 옮긴이 : 박해선 출판사 : 한빛미디어 코드 출처 https://github.com/rickiepark/introduction_to_ml_with_python GitHub - rickiepark/introduction_to_ml_with_python: 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다. Contribute to rickiepark/introduction_to_ml_with_python development by.. [Study] 신입 자라기 - 18 신입 자라기 18일 차 Task Logging 데이터 타입에 따라 인코딩, 벡터화를 다 진행 후 칼럼명 인버스 시켜서 학습까지 완료 전체 파이프라인 로직을 구상 중인데 머리가 복잡함(CS 공부를 더 해야 함) 단순한걸 너무 뇌절해서 시간을 낭비함 HashingVectorizer 사이킷런에서 제공하는 BoW 기반 벡터화 패키지 get_features_name_out 메서드가 없다. 벡터 라이져 객체 생성 시 n_features 만큼 칼럼명 만들어서 사용할 것 n_features : 출력 행렬의 기능(열) 수, 적은 수의 기능은 해시 충돌을 일으킬 수 있지만 많은 수는 선형 학습기에서 더 큰 계수 차원을 유발 재택 전에 보는 CS 메모리 할당 알고리즘 새로 적재될 데이터의 주기억장치에서 배치를 결정하는 전략.. [Study] 신입 자라기 - 17 신입 자라기 17일 차 Task Logging 텍스트형 데이터를 토크 나이저랑 해시 벡터 라이저 중에 어떤 걸, 무슨 상황에 써야 하는지 전혀 모르는 상황이었음 base코드를 계속 보고 인터넷 서치가 주 업무, 무기력해지는 재택 근무 였음 연속형 변수 스케일링? Boosting이나 Trees알고리즘에는 연속형 변수의 데이터 스케일링이 필요 없음 from sklearn.feature_extraction.text import HashingVectorizer hv = HashingVectorizer(n_features=300000) %time hv.transform(twenty.data) get_feature_names() 불가능 재택 전에 보는 CS 메모리 관리 전략 메모리 시스템은 메모리 위치를 관리하며 .. [Book] 6. 알고리즘 체인과 파이프라인 - (1) Book Title : Introduction to Machine Learning with Python - 파이썬 라이브러리를 활용한 머신러닝 - 지은이 : 안드레아스 뮐러, 세라 가이도 옮긴이 : 박해선 출판사 : 한빛미디어 코드 출처 https://github.com/rickiepark/introduction_to_ml_with_python GitHub - rickiepark/introduction_to_ml_with_python: 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 도서 "[개정판] 파이썬 라이브러리를 활용한 머신 러닝"의 주피터 노트북과 코드입니다. Contribute to rickiepark/introduction_to_ml_with_python development by.. [Study] 신입 자라기 - 16 신입 자라기 - 16일 차 Task Logging 첫 재택근무 원격 접속에 문제가 있어서 업무시간을 원격 설정하는데 소비 앙상블 학습이란 여러 개의 분류기를 생성하고 각 예측들을 결합함으로써 더욱 정확한 예측 결과를 도출하는 것 앙상블 학습 유형 1. Voting 여러 개의 분류기가 투표를 통해 최종 예측 결과를 결정하는 방식 서로 다른 알고리즘을 가진 분류기를 결합 하드 보팅 : 다수결 투표, 각 모델의 predict 결과를 취합하여 가장 많이 예측된 클래스로 최종 예측 소프트 보팅 : predict 클래스가 아닌 predict_proba(예측 확률)을 모든 모델로부터 받아서, 각 클래스 당 예측 확률 값을 평균 내서 최종 예측 2. Bagging 여러 개의 분류기가 투표를 통해 최종 예측 결과를 결정.. 이전 1 ··· 22 23 24 25 26 27 28 ··· 33 다음