快科技7月16日音讯,近来,Meta宣告,将开发一款名为CM3Leon的AI模型,该模型能够依据文本内容生成图片,也能够为图片生成文本描绘。
Meta方面表明,CM3Leon在文生图方面的体现,达到了业界最高水平。
现在,Meta现已演示了CM3Leon的体现,展示了该模型在包含杂乱的文本提示生成图片、依据文本指令修改图画等方面的体现。
据悉,为了练习该模型,Meta使用了数百万张来自Shutterstock的授权图片,有着高达70亿个参数,这是OpenAI的EALL-E2模型的两倍以上。
不过,Meta也供认,现阶段的CM3Leon模型有几率存在数据成见的问题,依然需求职业监管。
CM3Leon是一款根据Transformer神经网络结构的模型,该神经网络的特性是使用注意力机制来处理输入数据。
这一特色使得相较根据Transformer神经网络的模型,相较根据diffusion的模型具有更高的练习功率,且计算成本更低。
扫一扫关注公众号