728x90
1.시각화 파일 준비
터미널에 다음명령어를 통해 각 단어에 대한 벡터 표현이 저장된 파일과
metadata파일을 생성한다.
!python -m gensim.scripts.word2vec2tensor --input 학습모델이름 --output 모델이름
또는 subprocess를 통해서도 다음 명령어를 실행할수있다.
import subprocess
# 입력 파일과 출력 파일 경로 설정
input_model = "kor_w2v" # 모델 파일 경로
output_model = "kor_w2v_output" # 출력 파일 경로
try:
# word2vec2tensor 명령어를 subprocess로 실행
subprocess.run(['python', '-m', 'gensim.scripts.word2vec2tensor', '--input', input_model, '--output', output_model], check=True)
print("TensorFlow 형식으로 변환 완료!")
except subprocess.CalledProcessError as e:
print(f"명령어 실행 중 오류 발생: {e}")
except FileNotFoundError:
print("파일을 찾을 수 없습니다. 'kor_w2v' 경로와 파일 이름을 확인하세요.")
except Exception as e:
print(f"예기치 않은 오류 발생: {e}")
2.시각화
파일을 만들어 낸후 다음 사이트에 접속한다.
https://projector.tensorflow.org/
Embedding projector - visualization of high-dimensional data
Visualize high dimensional data.
projector.tensorflow.org
load를 누른후 만들어낸 파일들을 선택해주자
3.결과
시각화로 임베딩 벡터를 시각화 할수있다.
728x90
'AI' 카테고리의 다른 글
[AI] 허깅 페이스(Huggingface) (0) | 2025.01.06 |
---|---|
[AI] 워드 임베딩(Word Embedding) (0) | 2025.01.03 |
[AI]과적합(Overfitting)에 대해 (0) | 2025.01.03 |