新浪科技訊 1月28日上午消息,深度求索(DeepSeek)創始人梁文鋒深夜發文官宣,DeepSeek剛剛發布并開源了一款名為Janus-Pro-7B的多模態AI模型,可以生成圖像。
據梁文鋒介紹,在 GenEval和DPG-Bench基準測試中,Janus-Pro-7B擊敗了OpenAI的DALL-E3和stable Diffusion。”
新浪科技了解到,就在今日凌晨,DeepSeek工程師們已經在Hugging Face平臺上傳了Janus Pro 7B和1.5B模型。這倆模型是去年DeepSeek 10月發布的Janus模型升級版。
據DeepSeek介紹,Janus-Pro是一個新穎的自回歸框架,統一了多模態理解和生成。Janus-Pro 是基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 模型構建的。
在多模態理解任務中,Janus-Pro 采用 SigLIP-L 作為視覺編碼器,支持 384 x 384 像素的圖像輸入。而在圖像生成任務中,Janus-Pro 使用一個來自特定來源的分詞器,降采樣率為 16。(文猛)
(責任編輯:王治強 HF013)
【免責聲明】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
推薦閱讀: