데이터 증강
데이터 증강(Data Augmentation) 개념 기존 데이터를 변형하거나 가공하여 새로운 데이터를 생성하는 기법 데이터의 양과 다양성을 증가시켜 모델 성능을 향상시킴 예시 이미지 텍스트 필요성...
데이터 증강(Data Augmentation) 개념 기존 데이터를 변형하거나 가공하여 새로운 데이터를 생성하는 기법 데이터의 양과 다양성을 증가시켜 모델 성능을 향상시킴 예시 이미지 텍스트 필요성...
정형 데이터 전처리 데이터셋 : Kaggle Wine Reviews Dataset 데이터프레임 불러오기 import pandas as pd df = pd.read_csv('winemag-data_first150k.csv') 수치형 데이터 전처리 결측치 처리 결측치 확인 ...
데이터 EDA(Exploratory Data Analysis) 데이터를 본격적으로 분석하기 전에 데이터를 탐색하고 이해하는 과정 데이터의 분포, 특성, 이상치, 결측치 등 데이터 품질에 영향을 미치는 요인을 파악하는데 핵심적인 단계 정형 데이터 EDA 단계 데이터프레임의 각 컬럼과 값 확인하기 결측지...
문제 정의와 설정 목표 설정이 중요한 이유 데이터 수집 전에 목표를 정확히 정의하면 필요한 데이터의 형태와 특성을 파악할 수 있음 불필요한 데이터 수집을 방지 고품질의 데이터 확보 가능 목표를 잘못 설정할 경우 데이터의 품질 저하로 AI 모델의 성능이 떨어짐 ...
데이터 품질 데이터의 증가 2000년대 초반 ~ 2023년까지 생산한 데이터의 양이 90ZB에 달함 이는 그 이전 5000년간 쌓은 데이터의 3000배가 넘는 수치 1인당 일주일에 1TB 용량의 데이터를 생성하는 것과 같은 상황 데이터 품질의 정의 데이터 유형(정형, 비정형)에 따라 다르다 일반적인 데이터 품질 기준의...
데이터와 AI 모델 AI 시스템은 코드(모델 및 알고리즘)와 데이터로 구성 서비스 출시 전: 모델 성능 달성을 위한 투자 비율 데이터: 50% 모델링: 50% 서비스 출시 후: 모델 성능 달성을 위한 투자 비율 데이터: 80% 모델링: 20% ...
프로토콜과 소켓 프로토콜이란? 컴퓨터 간 데이터를 송수신하기 위한 통신 규약 소켓을 생성할 때, 데이터 전송 방식을 결정하는 주요 요소 구성 domain: 사용되는 프로토콜 체계 (예: IPv4, IPv6) type: 데이터 전송 방식 (예: TCP, UDP) protocol: 특정 전송 방식 ...
네트워크 프로그래밍이란? 네트워크로 연결된 둘 이상의 컴퓨터 사이에서 데이터를 송수신하기 위해 소켓을 기반으로 프로그래밍하는 것 소켓 프로그래밍이라고도 부른다 모바일 앱 개발 등 최근 프로그래밍 환경에서는 네트워크 요소가 거의 모든 영역에 포함된다 소켓(Socket) 네트워크 상에서 데이터를 주고받기 위해 사용되는 표준화된 소...
https://dacon.io/competitions/official/235837/overview/description dacon에서 예전에 진행한 따릉이 대여량 예측 AI 대회로 모델 연습을 진행하였다 데이터 구조 Train Data date_time : 일별 날짜 wind_direction: 풍향 (degree) sky_co...
Examples of sequential data sequential data는 순서와 흐름이 중요한 형태 텍스트(Text): 문장은 단어의 개수가 서로 다름 예: “The quick brown fox jumps over the lazy dog” → 단어 개수: 9 오디오(Audio): 오디오 데이터는...