产品介绍
该项目是本人在API与人工智能课程中所完成的期末项目,用户使用图片笔记APP进行相册管理搜索,通过图像分析功能,系统可自动识别图片中的文字、物体,并对图片进行分类,用户可通过文字智能搜索出图片。实现了用户对大量图片的快速检索功能,提升用户体验。主要运用到图像识别API技术与通用文字识别API技术,已广泛开始使用到市场中,具有一定的可行性。
价值主张
图片笔记就是针对该痛点对现在已有的照片类APP进行整合和优化。其中,该APP使用到的人工智能技术有:百度AI开放平台的通用物体和场景识别API,OCR文字识别API。
人工智能概率性考量
曾在微软工作过的黄鼎隆认为人工智能+图片搜索更具有价值,也是将人工智能技术推向成熟商业化的最短路径,他认为在图片搜索背后拥有一个千亿级的市场。背后的技术逻辑是相通的:通过机器学习,分析上亿个训练素材,从而形成对图片中各种元素的认识和了解后,机器就可以根据某一素材的「内部规律」,识别和搜索目标图片中的语义标签。根据黄鼎隆给出的数据,目前 Product AI 能够识别的㲏准确率已经优于人工识别,而相对于原本传统的「人工贴标」的方式,这家公司提供的解决方案提高了 8% 左右。
设计可行性
- 用户可欲性(Desirability):符合用户快速管理相册的需求,占用用户设备内存少并能让效果实现最大化。
- 技术可行性(Feasibility):通过图像分析功能,系统可自动识别图片中的文字、物体,并对图片进行分类,用户可通过文字智能搜索出图片。
- 商业可行性(Feasibility):开发成本较低,功能主要是通过调用API实现,支持标准化接口封装,调用简单,只需获取用户相册的权限调用AI开放平台的API即可获取识别结果,经过对市面上相册管理类APP的调查,发现其中不乏有几款APP,但是其功能都很单一,将这些功能进行整合在一起的APP少之又少。另外,随着人工智能的高速发展,让图像处理变得更加简便,用户对于只需一个APP便能对相片进行高效管理的APP是需要的。
人工智能API加持
| 功能优势 |
解决痛点 |
| 基于百度海量数据,利用深度学习技术及高精度算法不断迭代模型,准确率业界领先 |
保证识别的准确性以更好地分类 |
| 支持识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景,接口返回大类及细分类的名称结果 |
能更精准的对图片进行分类 |
| 检测出图片中多个主体的坐标位置,并给出主体的大类标签和标签的置信度得分,对海量图片进行分类、打标签 |
辅助物体识别,让结果更加精准。 |
| 功能优势 |
解决痛点 |
| 支持多语种识别: 通用文字识别、含位置信息版支持对中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种内容的识别,并支持中、英、日、韩四语种的类型检测 |
能够识别多种类型的字体内容,能解决大多数的识别问题 |
| 使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验 |
能够文字输入标签快速查找所需图片 |
价值主张画布

价值主张链
- 相册概览和智能分类、快速搜索
- 通过调用通用物体和场景识别 & 图像主体检测API返回图像的类别,给图片打上标签分类。
- 通过获取用户的照片去开放平台调用api,获得结果内容。
总结:该产品有利用互联网平台的平台资源特性,通过使用百度AI开放平台的通用物体和场景识别API,OCR文字识别API,表达了该APP的价值主张。