728x90 반응형 Python16 [ViT] Vision Transformer 구현 -0 Linear Projection of Flattened Pathes Vision Transformer를 모듈별로 구현하며 궁금한 점을 기록했다. Vision Transformer(ViT)의 데이터(이미지) 처리 프로세스를 ChatGPT에게 물어봤다. 입력 이미지에서 패치 추출: 입력 이미지에서 패치를 추출합니다. 일반적으로는 16x16 크기의 패치를 사용합니다. 이는 이미지의 크기에 따라 조정될 수 있습니다. 임베딩: 추출한 각 패치는 먼저 임베딩(embedding)되어 벡터로 변환됩니다. 이를 위해 일반적으로 선형 변환(linear transformation)과 사전 학습된(Pre-trained) 모델을 사용합니다. 위치 임베딩: 임베딩된 패치의 위치 정보를 제공하기 위해 위치 임베딩(Positional embedding)이 추가됩니다. 이는 각 패치의 위치에 대한 고.. 2023. 4. 21. RuntimeError: CUDA error: device-side assert triggeredCUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.For debugging consider passing CUDA_LAUNCH_BLOCKING=1. 장 시간 훈련 뒤, 새 출발하는 마음으로 컴퓨터를 재부팅하고 실행하니 다음과 같은 오류가 발생했다. cuda kernel에 예기치 않은 오류가 발생했나보다. 해결 방법 import os os.environ['CUDA_LAUNCH_BLOCKING'] = "1" import 선언 시 윗 줄을 추가해준다. cuda kernel을 강제로 동기적으로 실행 시키는 코드이다. 근본적인 해결 방법은 아닌듯 하다. 2023. 4. 19. KeyError: 15 - Dataset 클래스 정의 할 때 pandas 사용 주의점 Segmentation 모델을 훈련하기 위해 훈련 코드는 복붙, 수정하고 Dataset 클래스는 직접 만들었다. 그랬더니 아래와 같은 오류가 발생했다. 처음에는 복붙, 수정하면서 파라미터가 꼬인 줄 알았지만, pandas의 인덱싱 에러다. 하필 0번째 인덱스를 확인했을 때 잘 돌아가서 오류 위치를 찾는 데 더 오래 걸렸다. 15번째 인덱스를 조회하면 다음과 같이 오류가 발생한다. from sklearn.model_selection import train_test_split train_df,val_df,_,__ = train_test_split(train_df,train_df,test_size=0.2,random_state=CFG['SEED'],stratify=train_df.cls) train_datas.. 2023. 4. 16. [GUI 기반 Face Toy Project -6] real time face alignment opencv 이전 글에서 다룬 face alignment를 이 글에서 실시간으로 적용해 보도록 한다. [GUI 기반 Face Toy Project -5] face alignment opencv 이전 글에서 real time face swap (replacement)를 했다. [GUI 기반 Face Toy Project -4] real time face swap 이전 글에서 2개의 얼굴 사진을 이용해서 face swap을 했다. [GUI 기반 Face Toy Project -3] 들로네 삼각 변환(Delaunay yeeca.tistory.com 실행 결과는 아래와 같다. 코드는 이전 pyqt5 코드에서 수정, 추가했다. def test_m4(frame): frame = face_align(frame) return fr.. 2023. 4. 11. 이전 1 2 3 4 다음 728x90 반응형