728x90
반응형

전체 글 96

구내식당 식수 인원 예측 AI 경진대회 ( XGBRegressor )

https://dacon.io/competitions/official/235743/overview/description 구내식당 식수 인원 예측 AI 경진대회 - DACON 좋아요는 1분 내에 한 번만 클릭 할 수 있습니다. dacon.io 나는 매주 데이콘의 우수 코드를 분석하고 공유하는 스터디를 진행하고 있다. 이 대회는 구내식당의 요일별 점심, 저녁식사를 먹는 인원을 예측하는 대회였고, 1등을 한 분의 코드를 분석해봤다. 코드는 아래에 첨부해놓을 것이고, 공부하면서 내가 몰랐거나 헷갈렸던 부분을 적어놨다. 1. MAE (Mean Absolute Error) - 실제 값과 예측 값의 차이(Error)를 절대값으로 변환해 평균화 - MAE는 에러에 절대값을 취하기 때문에 에러의 크기 그대로 반영된다. ..

CUAI 활동 근황 ( 공모전참여와 계획 등등 )

1 - 공모전참여 ( 중도 포기 하기는 했지만 ㅎㅎ ) 데이콘 대회의 우수코드를 분석하는 스터디를 매주 진행하고 있다. 스터디원 중 한명이 참여해보자고해서, 당차게 시도했으나, 중도 포기했다. 이유를 설명해보자면 다음과 같다. 1. 세 명 모두 자연어처리(NLP) 초보다. 2. 이전까지는 target column이 하나밖에 없었으나, 이 공모전은 무려 3개였다. 바로 포기한건 아니구, 1주일정도 머리를 꽁꽁 싸맸으나 실패했고, 무엇보다 스터디는 같이 성장하고, 공부하는 맛이 있어야한다고 생각한다. 며칠전 새벽에, 스터디원 중 한명이, 스트레스를 받고 있는게 느껴졌다. 뭔가 머리를 한 대 맞은 느낌이였다. 그래도 빅데이터를 꽤 다뤄본 나도 이렇게 머리가 아픈데, 이제 처음 시작한 친구는 얼마나 더 힘들고,..

데이콘 - 뉴스 토픽 분류 AI 경진대회

CUAI 스터디에서 진행한 첫번째 대회입니다 ! NLP라는 자연어처리가 토픽이었고, 처음 해보는 알고리즘이여서 재밌게 참여했습니다. 저는 양방향 LSTM 모델을 적용시켰는데, 아무래도 딥러닝이 아닌 머신러닝 알고리즘이다보니 정확도가 높게 나오지는 않았습니다. 다음번에는 GPU를 이용한 딥러닝 코드로 비슷한 주제의 대회를 참여해보려 합니다. 혹시 자연어처리의 정의나 과정이 궁금하시면 다음 링크를 들어가보세요 ! -> https://dacon.io/competitions/official/235670/codeshare/1801?page=1&dtype=recent 대회링크 : https://dacon.io/competitions/official/235747/overview/description

삼성전자, LPDDR5X D램 업계 최고 7.5Gbps 동작 검증

D램이란 말은 공대학생이나, 삼성전자 주주라면 잘 알지는 못하더라도, 익숙한 용어일거라고 생각합니다. DRAM은 Dynamic Random Access Memory 의 줄임말이며, 저장된 데이터가 시간과 전원의 끊김에 따라 소멸되는 특징을 갖고 있습니다. DRAM의 한 셀당 1 Transistor 와 1 Capacitor로 구성되어있죠. 요즘 반도체가 워낙 작게 만들려고 노력하다보니, DRAM도 마찬가지인데요. NAND Flash와 달리 셀을 수직으로 세워서 집적도를 높일 수 없기 때문에, 집적도를 높이기 위해 다른 방법이 필요합니다. 여기서 간단히 디램과 낸드플래시의 차이점을 구분하자면, 디램은 휘발성,게이트가 1개 / 낸드플래시는 비휘발성이고, 게이트가 2개인 점을 말할 수 있습니다. 여기서 추가된 ..

박막공정(Thin Film)에 대해 알아보자. ( feat. 공정기술, 양산기술 )

반도체에는 8대공정이 있고, 그 중 내가 가장 관심이 있는 박막공정에 대해 알아보자. 전자공학과 학생이라면 웨이퍼라는 용어는 익숙하게 들어봤을 것이다.나도 실리콘으로 구성된 반도체의 기본틀이라고 알고 있다. 이 웨이퍼 표면에 매우 얇은 막을 입히는데, 이 막은 전기가 통하지 않는 부도체 상태의 웨이퍼(실리콘은 부도체)가 전기적 특성을 지닐 수 있게 해준다. 즉, 이후 공정에서 회로 패턴과 구조가 잘 구현할 수 있도록 도와주는 역할을 한다. 반도체로 취업을 하고자 하는 학생들에게 어떤 직무를 가고 싶냐 물어보면, 대부분 공정기술이나 공정설계, 혹은 회로설계라고 답할 것이다. 만약 나처럼, 8대공정중 특정한 공정에 큰 관심이 있고, 흥미롭다. 라고 생각한다면 공정기술 혹은 양산기술 직무에 초점을 두고 취업 ..

아파텔 투자란 ?

여전히 취준을 하고 있는 4학년 대학생이지만, 취업이 확정된 곳이 있다보니 남는 시간에 고민이 되는게 바로 제태크인데요. 주식은 꾸준히 하고 있고 ( 물려있어서 아무것도 못하고 있지만 ) , 미래의 다른 투자 기회를 찾아 보고 있습니다. 요즘 가장 관심이 가는 곳이 바로 아파텔입니다. 아파텔이란 ? 아파트 + 오피스텔의 줄임말입니다. 제가 이해하기론, 주거용 오피스텔인데 좀 더 넓은 느낌아닐까 생각하고 있습니다. 제가 아파텔에 관심이 간 가장 큰 이유는 주택수에 포함되지 않기 때문인데요. 청약 점수에 영향을 주지 않는다고 하네요. 단, 등기 후 전입신고 시 주택 수에 포함된다고 합니다. ( 월세나 전세를 내줘야 한다는 의미로 이해했습니다. ) 만약 아파텔을 통한 투자를 한다면, 청약이 당첨될 때까지 꾸준..

데이터셋 나누기 / 특성 스케일 조정 / 그리드서치 / SVM

데이터셋을 훈련 데이터셋과 테스트 데이터셋으로 나누기 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = (X,y, test_size = 0.3 , random_state=0 , stratify=y ) 갓이키런의 model_selection 모듈에 있는 train_test_split 함수를 사용하면 데이터셋을 랜덤한 훈련 데이터셋과 테스트 데이터셋으로 나눌 수 있다. test_size = 0.3 으로 설정했기 때문에, 샘플의 30%가 X_test와 y_test에 할당된다. stratify = y 으로 설정하면 훈련 데이터셋과 테스트 데이터셋에 있는 클래스 비율이 원본 데이터셋과 동일하게 유지된다. 특..

4장 데이터 전처리 : 좋은 훈련 데이터셋 만들기

데이터 품질과 데이터에 담긴 유용한 정보의 양은 머신 러닝 알고리즘을 얼마나 잘 학습할 수 있는지 결정하는 중요한 요소이다. -> 학습 알고리즘에 데이터를 주입하기 전에 조사하고 전처리하는 것이 매우 중요하다. 실제로 데이터 엔지니어들이 시간을 가장 오래 쏟는 부분이 '데이터 전처리'라고 합니다. // 누락된 데이터 다루기 일반적으로 누락된 값은 데이터 테이블에 숫자가 아니라는 의미의 NaN이나 NULL과 같은 값을 사용합니다. 이러한 누락된 값을 무시해버린다면 예상치 못한 결과가 나오기도 합니다. 이런 누락된 데이터를 처리하기 가장 편한 방법은 누락된 데이터를 제거하는 것이다. df.dropna(axis=0) -> 행 제거 df.dropna(axis=1) -> 열 제거 df.dropna(thresh=4..

3장 사이킷런 첫걸음 : 퍼셉트론 훈련, 로지스틱 회귀, 결정 트리

위 책의 챕터를 코드를 직접 쳐보고, 정리하기 위해 업로드하는 글들이며, 챕터 3장의 내용들을 담았다. from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1, stratify=y) -> 데이터셋을 훈련 데이터셋과 테스트 데이터셋으로 분할합니다. (30%는 테스트 데이터 , 70%는 훈련 데이터 , stratify=y 는 계층화기능.) 많은 머신 러닝 알고리즘과 최적화 알고리즘은 최상의 성능을 위해 특성 스케일 조정이 필요하다. // from sklearnn.preprocessing import Standard..

주식 공부 - 인플레이션, 스태그플레이션 , 장단기 금리차

내가 이해한 용어들 정리 인플레이션 : 화폐가치 하락 -> 물가 상승 스태그플레이션 : 경기침체(stagnation)와 인플레이션이 동시에 발생 -> 일반적으로 불황기:물가하락 / 호황기:물가상승인데 최근에는 호황기 불황기 상관없이 물가는 계속 상승 & 코로나와 전쟁과 같은 요인들로인한 인플레이션 -> 스태그플레이션 발생 1)원자재 급등 -> 인플레이션 심화 2)러시아 제재 -> 경기 둔화 우려 1) + 2) -> 스태그플레이션 우려 심화 -> 장기금리 하락 ( 장단기 금리차 축소 ) 장단기 금리차란 ? 미국의 경우 : 국채 10년물-국채 2년물 국내의 경우 : 국채 10년물-국채 3년물 장단기 금리차가 확대 되고 있다 ? -> 경기를 낙관적으로 전망한다 -> 가치주 상승 경향 ( 반도체, 전기차, 건설..

728x90
반응형