使用API的图片笔记作品

hanxingting

776

收藏 2021-05-21

产品介绍

该项目是本人在API与人工智能课程中所完成的期末项目，用户使用图片笔记APP进行相册管理搜索，通过图像分析功能，系统可自动识别图片中的文字、物体，并对图片进行分类，用户可通过文字智能搜索出图片。实现了用户对大量图片的快速检索功能，提升用户体验。主要运用到图像识别API技术与通用文字识别API技术，已广泛开始使用到市场中，具有一定的可行性。

价值主张

图片笔记就是针对该痛点对现在已有的照片类APP进行整合和优化。其中，该APP使用到的人工智能技术有：百度AI开放平台的通用物体和场景识别API，OCR文字识别API。

人工智能概率性考量

曾在微软工作过的黄鼎隆认为人工智能+图片搜索更具有价值，也是将人工智能技术推向成熟商业化的最短路径，他认为在图片搜索背后拥有一个千亿级的市场。背后的技术逻辑是相通的：通过机器学习，分析上亿个训练素材，从而形成对图片中各种元素的认识和了解后，机器就可以根据某一素材的「内部规律」，识别和搜索目标图片中的语义标签。根据黄鼎隆给出的数据，目前 Product AI 能够识别的㲏准确率已经优于人工识别，而相对于原本传统的「人工贴标」的方式，这家公司提供的解决方案提高了 8% 左右。

设计可行性

用户可欲性（Desirability）：符合用户快速管理相册的需求，占用用户设备内存少并能让效果实现最大化。
技术可行性（Feasibility）：通过图像分析功能，系统可自动识别图片中的文字、物体，并对图片进行分类，用户可通过文字智能搜索出图片。
商业可行性（Feasibility）：开发成本较低，功能主要是通过调用API实现，支持标准化接口封装，调用简单，只需获取用户相册的权限调用AI开放平台的API即可获取识别结果，经过对市面上相册管理类APP的调查，发现其中不乏有几款APP，但是其功能都很单一，将这些功能进行整合在一起的APP少之又少。另外，随着人工智能的高速发展，让图像处理变得更加简便，用户对于只需一个APP便能对相片进行高效管理的APP是需要的。

人工智能API加持

通用物体和场景识别 & 图像主体检测 API

功能优势	解决痛点
基于百度海量数据，利用深度学习技术及高精度算法不断迭代模型，准确率业界领先	保证识别的准确性以更好地分类
支持识别动物、植物、商品、建筑、风景、动漫、食材、公众人物等10万个常见物体及场景，接口返回大类及细分类的名称结果	能更精准的对图片进行分类
检测出图片中多个主体的坐标位置，并给出主体的大类标签和标签的置信度得分，对海量图片进行分类、打标签	辅助物体识别，让结果更加精准。

通用文字识别(OCR) API

功能优势	解决痛点
支持多语种识别: 通用文字识别、含位置信息版支持对中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种内容的识别，并支持中、英、日、韩四语种的类型检测	能够识别多种类型的字体内容，能解决大多数的识别问题
使用通用文字识别技术，实现拍照文字识别、相册图片文字识别和截图文字识别，可应用于搜索、书摘、笔记、翻译等移动应用中，方便用户进行文本的提取或录入，有效提升产品易用性和用户使用体验	能够文字输入标签快速查找所需图片

价值主张画布

价值主张链

相册概览和智能分类、快速搜索
通过调用通用物体和场景识别 & 图像主体检测API返回图像的类别，给图片打上标签分类。
通过获取用户的照片去开放平台调用api，获得结果内容。

总结：该产品有利用互联网平台的平台资源特性，通过使用百度AI开放平台的通用物体和场景识别API，OCR文字识别API，表达了该APP的价值主张。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝