豆包支持带有指定文字的图片生成,App已开启测试

2024-12-08 10:09:42     来源:

近日,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定文本。用户可以在生图提示词中加入文本要求,如“一张带有「新年快乐」的图”,即可生成带有指定文字的图片。目前该功能已经在豆包APP开启测试,即梦也已小范围测试。

图片1.png

(用豆包生成带有文字的图片)

对文生图模型而言,如何在图像中精准生成文本一直是难题,尤其是中文文字,经常出现乱码。据介绍,相比英文字母,汉字字符结构更复杂,且字符数量要多两个数量级。豆包大模型团队相关负责人表示,豆包文生图模型通过打通LLM和DIT构架,具备更好的原生中文数据学习能力,并在此基础上强化了汉字生成能力,大幅提升了生成效果。

据观察,已有不少用户尝试使用该能力制作表情包、梗图漫画,或辅助生成海报,并在社交媒体平台发布。据介绍,当前该功能仅支持文生图时添加文字,暂不支持上传图片生成文字。

豆包负责人表示,该能力刚刚推出,仍在完善和优化中。目前绝大多数情况下豆包能够准确生成指定文字,但仍存在少部分错字、漏字或小字乱码等情况。“不管文字、图片、还是音乐生成功能,豆包都希望能够降低创作门槛,帮助人们更好地表达和创造。”据悉,豆包网页及电脑版也将在近期上线该能力。

豆包是字节跳动基于豆包大模型推出的AI智能助手,支持手机App、PC 电脑版、网页版、浏览器插件。作为全能AI 助手,豆包能为生活、学习、工作提供帮助。用户可以通过豆包搜索信息,答疑解惑,分析总结,提供灵感,辅助创作,提高生活和学习效率。


标签:

猜你喜欢

12月9日来京东搜索“1” 3C数码“疯狂星期一”携低价好物再临
文旅行业步入鸿蒙时代:400款应用及元服务鸿蒙化,共绘智慧文旅新未来
华为赋能制造业转型升级 共话数智未来
华为Mate70系列全面热销,“碰一碰”解锁出行、支付、分享新体验
更专业、更便捷、更贴心,随时随地问问小艺,帮你搞定生活所需
推动跨语言沟通迈向新境界,时空壶 W4 Pro 同声传译耳机
新高考选科就用升学e网通,助你轻松规划学业与职业生涯
人工智能与计算产业生态峰会|大咖分享智能与数据新观点
双捷科技发布第三代清洗消防机器人
折叠屏新标杆华为Mate X6今日正式开售,升级原生鸿蒙享900元好礼
更高含金量!正泰新能荣获EcoVadis集团层级金牌
鸿蒙生态闪耀2024数字科技生态大会 引领科技发展新机遇
“意”彩绽放,ICA(意卡)中国旗舰展厅升级启航!
权威发布 | 2025年QS世界大学排名,科廷大学再创新高!世界排名上升9名!
全链条服务释放生机,零秒空间产融模式揭示当下办公空间发展风向
内容生态火力全开,TikTok电商美区黑五以创纪录成绩收官
智能制造升级之旅,华为是企业最佳“同路人”
RSNA2024:拥抱AI 锐珂医疗智能创新助力可持续发展
中昊芯英泰则®AI计算集群系统入选“数字样板工程”实践案例
杰森·斯坦森降临《坦克世界》,假日行动2025今日开启
抖音生活服务推出“暖冬餐饮守护行动”,违规商家将受商品禁售等处置
北京教育信息化产业联盟人工智能教育专业委员会第一届理事会在京举办
奖项+3!以SASE构筑一体化办公安全方案,深信服优势何在?
焕然E新,开放共赢,施耐德电气开放自动化生态合作伙伴峰会成功举办
斗鱼x人民阅读联合出品《我的冠军指导》 获“青年影视创投计划年度关注短剧”称号
威胁防不住不如变思路!企业如何推进办公安全防护进入Next Level?
华为中国政企业务智能制造媒体沟通会在重庆举行
华为杨萍:以开放生态让智造生根
AI Agent元年的Salesforce和微盟,抓住AI赋能B端市场增长的关键趋势
斗鱼短剧亮相青年影视创投论坛 多维度促进短剧生态良性发展