전체 글

#Python #NLP #LLM #데이터분석
아래 글은 모두 'step by step [파이썬 비즈니스 통계분석]' 교재를 기초로 진행한 내용입니다. 모든 장은 이전 장과 이어져 있으니, 세부 내용 및 이전 글이 궁금하시다면 해당 블로그의 이전 장과 교재를 참고해주시면 되겠습니다.~~ 분산분석(ANOVA) 분산 분석은 명목척도로 측정된 독립변수와 등간 또는 비율척도로 측정된 종속변수 사이의 관계를 3개 이상 집단 간 평균의 차이로 검정할 때 사용한다. t - 검정에서 살펴보았듯, 평균을 비교하는 집단의 수가 2개 이하일 경우에는 t-검정 또는 z - 검정을 사용하고, 평균을 비교하는 집단의 수가 3개 이상일 때는 분산분석을 사용한다. 집단 A, B, C 의 평균값 Xa, Xb, Xc 자체는 그림(a)와 그림(b)가 동일하다. 하지만 (a)의 경우,..
협업(Collaboration)을 위한 'Git-Flow' 전략 우리는 깃과 깃허브를 원격 저장소로서의 기능, 동시에 버전관리와 백업, 나아가 '협업'을 위한 툴임을 앞선 글들을 통해 알 수 있었다. 그렇다면 본격적으로 이 협업을 위한 효과적인 Git-flow 전략을 한 번 살펴보자. 이 전략은 다른 말로는 Branch 전략이라고도 하는데, 여러 명의 개발자가 1개의 저장소를 사용하는 환경에서 효과적으로 저장소를 사용하기 위해 나온 개념이다. 이번엔 GitKraken이라는 GUI를 활용해 GIT 명령어를 활용한 업로드보다 쉽고 간단한 Git-flow 전략을 작성해보려 한다. (아래의 핵심 키워드들과 함께!) - Branch - Push (+commit) - Pull Request (+review) - M..
해당 글은 글쓴이가 SQL 공부하면서 중요한 점이나, 핵심 개념들을 입맛대로 정제하고 정리한 글입니다. 오개념을 발견하셨거나 피드백할 점이 있다면 언제든 댓글이나 질문을 통해 해당 글에 남겨주세요 :) 관계형 데이터베이스(Relational Database) 'RDBMS'(Relational Database Management System)라고도 불리는 이 'MySql'은 모든 데이터들의 정보를 데이터베이스라는 일종의 상자 안에 'SQL'이라는 언어를 사용해 원하는 대로 정보를 빼내고 넣고 수정할 수 있게 해주는 '데이터 베이스 관리 시스템'(Database Management System)이다. "그런데 이 Relational은 왜 붙은걸까?" 이제 본격적으로 한 번 알아보자. MySql/Oracle ..
1. Git과 GitHub Git과 GitHub의 관계는 어떻게 되는 걸까? 본격적으로 GitHub 사용방법과 그 역할(본질)에 대한 이야기를 나눠볼 차례다. 앞서 Git 이라는 강력한 '버전관리, 백업, 협업' 툴을 살펴보았다. 우리는 그 Git 을 크게 두 가지로 분류해볼 수 있는데 바로 '클라이언트'와 '서버'이다. Client: Git 커맨드 라인 프로그램과 소스트리, GitHub desktop 등 다양한 프로그램들이 내재한 곳. Server: Git 을 통해 만들어진 서로 다른 상태의 버전들, 파일, 내용을 저장하는 곳. 누구나 알 법한 Dropbox 라는 서비스와의 비교를 통해 개념을 살펴보자. Dropbox도 Git 과 마찬가지로 Client가 존재하고, Server가 존재한다. 하지만, D..
해당 글은 깃을 통해 문서화와 백업, 버전 관리 등을 통해 보다 효율성을 추구하고자..! 제 맘대로, 제 임의대로, 제 입맛대로! 정리한 글입니다. 다소 개념들이 난잡하고 이해하기 힘들다고 느끼실 수 있습니다. 그래도 저만의 방식으로 이해하기 쉽고, 최대한 간단하게 작성했기에 단순한 정리에서 그치는 것이 아닌, 여러분의 학습과 숙달에 도움이 되었으면 좋겠습니다. 개념적인 오류와 틀린 부분이 언제, 어디서든 발생할 수 있기에 해당 부분에 대한 피드백이 있다면 언제든 환영입니다. 0. 'GIT' 이 뭐지? 수십 년 동안 수많은 파일과 정보들이 끊임없이 변화하고 복제되고 있다면... 우린 그 문서, 정보들을 어떻게 보관하고 열어보며 계속해서 사용할 수 있을까? 우린 이 문서들과 정보를 보다 정돈되고, 보기 편..
해당 글은 글쓴이가 SQL 공부하면서 중요한 점이나, 핵심 개념들을 입맛대로 정제하고 정리한 글입니다. 오개념을 발견하셨거나 피드백할 점이 있다면 언제든 댓글이나 질문을 통해 해당 글에 남겨주세요 :) 데이터베이스란?? 방대한 정보와 이야기를 담고 있는 '도구'. 데이터와 관련해서 일어날 수 있는 일들은 너무나도 다양하다! 복잡한 기술을 잠시 미뤄두고, 우리는 이 데이터를 어떻게 바라보고, 그 데이터를 어떤 방식으로 저장하고, 입력하며 출력할 수 있는지 그 키워드를 통해 함께 살펴보자! Create의 'C', Read의 'R', Update의 'U', Delete의 'D' 'CRUD' 데이터를 '생성'하고, 생성된 데이터를 '읽고', 읽은 데이터를 '수정'하며, '삭제'하는 작업을 일컬어 '데이터베이스 ..
jo._.on_
Jo._.on's Lab