본문 바로가기

스파르타내일배움캠프TIL

1/3, 서른 번째 날의 TIL(Medium - Baker) 오늘은 Docker-compose를 이용해서 Django 컨테이너도 실행시켜보고 Django 강의도 들었는데, 이 내용은 따로 GitHub에 마크다운 파일로 정리해두려고 한다. 그 외에는, 오랜만에 Medium 아티클을 읽었는데 그 중에 Baker라는 스마트 앱 개발 사례를 통해 LLM과 현대적인 개발 도구의 활용법에 대해 배웠다. 이 앱은 AI를 활용해 냉장고에 있는 재료로 만들 수 있는 요리 레시피를 추천하는 시스템이다. Baker는 파이썬으로 개발된 오픈소스 프로젝트로, 재료 데이터셋을 구조화하고 이를 기반으로 웹 애플리케이션을 만든 사례이다. 특히, 데이터 처리 과정에서 최신 GPT-4o 모델을 사용해 이전에 실패했던 데이터 파싱 문제를 해결하고, 100% 성공률로 데이터를 정리했다. 이후, 단위.. 더보기
1/2, 스물 아홉 번째 날의 TIL 오늘은 RNN과 워드 임베딩에 대해 공부했다. RNN(순환 신경망)이란 입력과 출력을 시퀀스 단위로 처리하는 모델로, 번역기나 감성 분류, 챗봇 같은 다양한 문제에 활용될 수 있다. RNN은 은닉층에서 이전 상태를 기억하며, 입력 벡터와 은닉 상태를 기반으로 새로운 출력을 생성한다. 특히, 입력과 출력의 길이를 다르게 설정할 수 있어 유연한 활용이 가능하다. 하지만 기본적인 RNN(바닐라 RNN)은 장기 의존성 문제를 겪는다. 이를 해결하기 위해 **LSTM(Long Short-Term Memory)**과 GRU(Gated Recurrent Unit) 같은 개선된 모델들이 등장했다. LSTM은 입력 게이트, 삭제 게이트, 출력 게이트를 추가하여 불필요한 정보를 제거하고, 중요한 정보를 효율적으로 기억한다.. 더보기
12/30, 스물 여섯 번째 날의 TIL(Dockerfile) 저번 내용에 이어 제일 중요한 도커파일에 대해 공부를 해보았다. 어떻게 사용하는지, 그리고 어떻게 빌드를 하고 어떤 명령어들이 있는지 알아보았다. 도커파일은 운영 체제가 다를 경우 사용하기 편리할 것 같다.Dockerfile도커 이미지를 생성할 때 스크립트를 작성하는데, 이 스크립트 파일이 도커파일이다. IDE에서 만들 수도 있고, 메모장이나 notepad를 이용해서 확장자 없이 Dockerfile이라고 저장하면 된다.텍스트 편집기로 생성한 도커 파일은 다음과 같은 모양이며,VSCode에서 작성한 도커파일은 위와 같은 모양이 생겨서 구분이 편하다. 이런식으로 Dockerfile을 만든 다음 터미널에서docker built -t img_name ./이 코드를 입력하면 도커파일 내용대로 빌드를 하는데, 처음.. 더보기
12/26, 스물 네 번째 날의 TIL(도커) 어제에 이어서 도커 공부를 더 해보았다. 사용하면 할수록 도커는 사용하기도 편리하고 정말 유요한 것 같다. 아직은 사용할 일이 없었지만, 나중에 프로젝트를 하거나 다른 작업을 할 때 OS가 다르면 굉장히 유용할 것 같다. 지금은 Mac을 쓰고 있지만 나중에 다른것도 사용해보려고 생각중이다.도커 - 포트포워딩인터넷이나 네트워크 외부에서 내부 네트워크의 특정 기기나 서비스에 접근할 수 있도록 하는 기술인데, 편지 배달을 예로 들자면 보통 우편은 집 주소까지만 도달하지만 포트포워딩을 설정할 경우 특정 포트 번호를 통해 어느 방(기기)으로 편지를 보내야 할지를 알려주는 것이다.  도커에서 포트포워딩은 호스트 머신(도커가 실행되는 컴퓨터)의 포트를 컨테이너 내부의 특정 포트로 연결하는 작업으로, 도커 컨테이너는 .. 더보기
12/24, 스물 두 번째 날의 TIL(도커) 벌써 크리스마스 이브라니, 올해도 정말 빨리 간 것 같다. 그래도 한 해의 마지막에 지금처럼 열심히 공부하고 새로운 내용을 배우고 있는 점이 뿌듯하다. 아직 배울 내용이 많이 남았으니, 올해를 잘 마무리하고 내년에도 열심히 해야겠다도커대학교를 다닐 때는 삼성 노트북을 계속 썼는데, 크게 불편한 점이 없고 도커라는 것을 잘 몰라서 모든 것을 로컬에서 다운받아서 돌렸던 것 같다. 간단한 과제 정도는 로컬에서도 가능하지만, 후에 취업을 하게 되어 회사에 들어간다고 하면 도커는 필수이므로 지금부터 적극적으로 활용하려고 다운받아서 공부하는 중이다. 도커를 쓰는 이유는, 먼저 환경 일관성 보장이 있다. 사용하려는 프로그램의 버전이 다른 경우, 내 컴퓨터에서는 작동이 잘 되는데 다른 사람의 컴퓨터에서는 작동이 잘 안.. 더보기
12/23, 스물 한 번째 날의 TIL(NLP) 오늘부터 AI활용 강의가 추가가 되었다. 이번주부터 도커와 쿠버네티스, 그리고 과제도 할 내용이 있었는데 강의가 추가되는줄은 몰라서 빨리 듣고 넘어가야겠다. Django 강의도 선지급 되었으므로, 얼른 마무리하고 주말에는 Django 강의를 들어봐야지.NLP어간 추출, 표제어 추출 : 단어를 줄일 수 있는 기법이다. 눈으로 보기에는 다른 단어이지만 하나의 단어로 일반화시킬 수 있으면 일반화시켜서 문서 내의 단어 수를 줄이는 것이다. 표제어 추출은 am, are, is의 뿌리 단어 be를 보았을 때 이 표제어 be를 추출하는 것이고, 어간 및 접사를 분리하는 것도 가능한데 cats에서 cat : 어간, s : 접사로 분리를 하는 것이다.주의 해야 할 점은 단어의 형태가 적절히 보존되지만 표제어 추출기가 본.. 더보기
12/20, 스무 번째 날의 TIL(데이터 전처리, Medium, 코드카타) 벌써 캠프의 4주가 지났다. 되돌아보면 정말 빠른 시간이었던 것 같다. 4주동안 새로 배운 내용도 많았고, 원래 알고 있던 내용을 더 강화해서 배운 내용도 많은 것 같다. 앞으로 시간이 더 많이 남았기 때문에, 퍼지지 말고 페이스를 유지해가면서 꾸준히 내 할 일을 하고 새로운 것을 배워서 내걸로 만들어야겠다.과제를 하면서 데이터 전처리에 대한 내용을 다시 정리해보게 되었다. 전처리의 순서나 여러가지 기법들을 좀 더 알고 있으면 전처리에 확실히 도움이 되는 것 같다.그리고 오늘도 Medium에서 읽은 아티클을 정리하고 오늘 풀어본 알고리즘 문제 하나를 정리해보았다.1. 데이터 전처리모든 작업에 있어서, 데이터 전처리 과정이 제일 중요한 것 같다. 실제로 현업에서도 데이터 전처리에 상당히 많은 시간을 투자한.. 더보기
12/19, 열아홉 번째 날의 TIL(NLP) NLP 교재를 e-book으로 읽어보고 있는데, 매주 4개의 챕터씩 읽고 노션에 정리를 하는 중이다. 반복해서 읽고 검색하다 보니 거의 이해를 할 수 있었고, 어떤 내용이 중요한지 어떤 문제가 있는지도 알게 되어 좋았다.1. NLP자연어(Natural language) : 우리가 일상에서 사용하는 언어자연어 처리(Natural language processing) : 자연어의 의미를 분석하여 컴퓨터가 처리할 수 있도록 하는 일사용분야 : 음성 인식, 내용 요약, 번역, 사용자의 감성 분석, 텍스트 분류 작업, 챗봇 등구체적 예시 : 구글 어시스턴트, 파파고, Grammarly(영어 문법 수정), Otter.ai(회의 내용 요약) 등오늘날 자연어는 다양한 분야에서 사용되고 있고, 이는 우리 생활 속에서 많.. 더보기