全部版块 我的主页
论坛 站务区 十一区 新手入门区
736 0
2021-05-21

产品介绍

该项目是本人在API与人工智能课程中所完成的期末项目,用户使用图片笔记APP进行相册管理搜索,通过图像分析功能,系统可自动识别图片中的文字、物体,并对图片进行分类,用户可通过文字智能搜索出图片。实现了用户对大量图片的快速检索功能,提升用户体验。主要运用到图像识别API技术与通用文字识别API技术,已广泛开始使用到市场中,具有一定的可行性。

价值主张

图片笔记就是针对该痛点对现在已有的照片类APP进行整合和优化。其中,该APP使用到的人工智能技术有:百度AI开放平台的通用物体和场景识别API,OCR文字识别API。

人工智能概率性考量

曾在微软工作过的黄鼎隆认为人工智能+图片搜索更具有价值,也是将人工智能技术推向成熟商业化的最短路径,他认为在图片搜索背后拥有一个千亿级的市场。背后的技术逻辑是相通的:通过机器学习,分析上亿个训练素材,从而形成对图片中各种元素的认识和了解后,机器就可以根据某一素材的「内部规律」,识别和搜索目标图片中的语义标签。根据黄鼎隆给出的数据,目前 Product AI 能够识别的㲏准确率已经优于人工识别,而相对于原本传统的「人工贴标」的方式,这家公司提供的解决方案提高了 8% 左右。

设计可行性

  • 用户可欲性(Desirability):符合用户快速管理相册的需求,占用用户设备内存少并能让效果实现最大化。
  • 技术可行性(Feasibility):通过图像分析功能,系统可自动识别图片中的文字、物体,并对图片进行分类,用户可通过文字智能搜索出图片。
  • 商业可行性(Feasibility):开发成本较低,功能主要是通过调用API实现,支持标准化接口封装,调用简单,只需获取用户相册的权限调用AI开放平台的API即可获取识别结果,经过对市面上相册管理类APP的调查,发现其中不乏有几款APP,但是其功能都很单一,将这些功能进行整合在一起的APP少之又少。另外,随着人工智能的高速发展,让图像处理变得更加简便,用户对于只需一个APP便能对相片进行高效管理的APP是需要的。

人工智能API加持

  • 通用物体和场景识别 & 图像主体检测 API
功能优势 解决痛点
基于百度海量数据,利用深度学习技术及高精度算法不断迭代模型,准确率业界领先 保证识别的准确性以更好地分类
支持识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景,接口返回大类及细分类的名称结果 能更精准的对图片进行分类
检测出图片中多个主体的坐标位置,并给出主体的大类标签和标签的置信度得分,对海量图片进行分类、打标签 辅助物体识别,让结果更加精准。
  • 通用文字识别(OCR) API
功能优势 解决痛点
支持多语种识别: 通用文字识别、含位置信息版支持对中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种内容的识别,并支持中、英、日、韩四语种的类型检测 能够识别多种类型的字体内容,能解决大多数的识别问题
使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验 能够文字输入标签快速查找所需图片

价值主张画布

image

价值主张链

  • 相册概览和智能分类、快速搜索
  • 通过调用通用物体和场景识别 & 图像主体检测API返回图像的类别,给图片打上标签分类。
  • 通过获取用户的照片去开放平台调用api,获得结果内容。

总结:该产品有利用互联网平台的平台资源特性,通过使用百度AI开放平台的通用物体和场景识别API,OCR文字识别API,表达了该APP的价值主张。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群