텍스트와 이미지의 융합: 멀티모달 모델 Transfusion!


텍스트와 이미지의 융합: 멀티모달 모델 Transfusion!

Transfusion은 텍스트와 이미지를 동시에 이해하고 생성하는 멀티모달 AI 모델이다. Transformer 기반으로, 텍스트에는 언어 모델링, 이미지에는 Diffusion을 적용하여 뛰어난 성능을 보여준다. (출처: ai.meta.com)

목록으로