金融界2024年4月9日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“一种图片描述方法及相关设备“,公开号CN117851625A,申请日期为2023年11月。
专利摘要显示,本申请公开了一种图片描述方法及相关设备,可以获取待描述图片、多模态语言模型以及描述提示文本;将描述提示文本输入至多模态语言模型,通过多模态语言模型对待描述图片进行图片描述,得到符合图片描述规则的第一图片描述文本;其中,描述提示文本为根据样本图片描述文本和预测图片描述文本对图片描述规则对应的初始提示文本进行修正得到,样本图片描述文本根据样本图片和图片描述规则获得,预测图片描述文本由多模态语言模型对样本图片进行图片描述得到,初始提示文本为根据图片描述规则初始化得到。本申请可以降低图片标注过程中的繁琐性,降低工作人员的工作量,提高图片标注过程中的工作效率。
来源:金融界