T

Tar 1.5B

由 csuhan 开发
通过文本对齐表示实现视觉理解与生成的统一模型
下载量 253
发布时间 : 6/11/2025

模型简介

Tar是一个通过文本对齐表示统一视觉理解和生成的模型,为视觉领域的研究和应用提供新的思路和方法。

模型特点

文本对齐表示
通过文本对齐的表示方式统一视觉理解和生成任务
多任务统一
在一个模型中同时支持视觉理解和生成任务
开源许可
采用Apache 2.0许可证,允许商业和研究使用

模型能力

视觉理解
图像生成
视觉-语言对齐
多模态任务处理

使用案例

计算机视觉
图像描述生成
为输入图像生成文本描述
文本到图像生成
根据文本描述生成对应图像
教育
视觉辅助学习
通过视觉和文本的交互帮助学习
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase