0.개요오늘도 심심풀이로 StableDiffusion 모델 기반으로 AI 그림을 뽑아내던중 저위에 있는 CheckPoint랑 VAE가 뭘하는 친구들인지 갑자기 궁금증이 생겨서 조사하게되었다. 1. Diffusion 모델이를 알기 위해서는 Diffusion 모델을 알아야하는데 처음에는 노이즈를 포함한 무작위 데이터를 만들고, 그 데이터를 점차적으로 '복원'하는 방법을 학습하는 방식이 Diffusion 모델의 방식이다.https://asa9874.tistory.com/504 [AI] Diffusion 모델이 뭐지?개요Diffusion 모델 이라는 말을 요즘 많이 듣게 되는데 AI 이미지를 뽑을때도 Stable Diffusion을 사용하고 있어서 이게 뭘의미하는 모델인지 궁금하여 조사하였다. Diffu..
개요Diffusion 모델 이라는 말을 요즘 많이 듣게 되는데 AI 이미지를 뽑을때도 Stable Diffusion을 사용하고 있어서 이게 뭘의미하는 모델인지 궁금하여 조사하였다. Diffusion 모델이란?Diffusion 모델은 확률적 생성 모델이라고 하는 모델이라고 하는데 간략적으로 조사해본결과 노이즈를 추가하고 노이즈를 제거하는 과정을 거치면서 원하는 데이터를 생성하는 모델이다. 노이즈를 추가하고, 그 노이즈를 다시 제거하는 과정을 통해 새로운 데이터를 생성하는 방식으로 초기에는 데이터에 노이즈를 더해 점차적으로 의미를 잃게 만들고, 그 후에는 역방향 과정을 통해 노이즈를 제거하면서 원래의 데이터를 재구성하거나 새로운 데이터를 생성한다. 전방 과정(Forward Process)?아래 과정은..
아나콘다데이터 과학, 머신러닝, 인공지능, 과학 계산 등을 위해 설계된 파이썬(Python)과 R의 통합 배포판이다. 기본적으로 이에 필요한 다양한 라이브러리들을 포함하고있어서 편하게 사용할수있다. 아나콘다 설치,사용1. 홈페이지에서 설치난 윈도우 버전으로 다운로드 하였다.https://www.anaconda.com/ Anaconda | The Operating System for AIDemocratize AI innovation with the world’s most trusted open ecosystem for data science and AI development.www.anaconda.com Path을 추가하면 다른 앱들과 충돌이 일어날수있다고 경고하는데 CMD에서 명령어를 못쓰는건 너무 ..
AI에 대해 학습되지않은 상태로 깡으로 머리박았을 시점에 작성한 글임(아무런 영양가 없음)1.GPT2란GPT 모델중 하나로 최대 15억 개의 파라미터를 가지고있다.(참고로 GPT-3가 1750억개) 대신 직접 모델 파일을 다운받아서 사용할수 있기 때문에 이번기회에 한번 다운받아서 사용해 보았다. 2.깃헙 코드Openai의 gpt-2 돌리기 위한 코드는 다음에서 clone 하여 사용하였다.https://github.com/openai/gpt-2 GitHub - openai/gpt-2: Code for the paper "Language Models are Unsupervised Multitask Learners"Code for the paper "Language Models are Unsupervised..
1.LLM(Large Language Model)방대한 양의 텍스트 데이터를 기반으로 학습한 인공지능 모델로, 자연어 처리(NLP) 작업을 수행하는 데 사용한다.대규모 데이터셋과 강력한 컴퓨팅 자원을 사용하여 언어 패턴을 학습하고 이해한다. 2.특징2-1.대규모 데이터LLM은 인터넷, 책, 기사, 논문 등 다양한 출처에서 수집한 방대한 양의 텍스트 데이터를 학습하여 다양한 주제와 문맥에 대한 이해도를 높인다. 2-2.복잡한 언어 이해LLM은 문법, 의미, 문맥, 어휘 등을 학습하여 자연어를 이해하고 생성하는 능력이 뛰어난 능력으로 텍스트 생성, 번역, 요약, 질문 응답 등의 작업에서 활용된다. 2-3.사전 학습과 미세 조정대규모 텍스트 데이터로 사전 학습(pre-training)을 하고, 특정 작..