HUAWEI ML Kit 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
HUAWEI ML Kit 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
HUAWEI ML Kit 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
HUAWEI ML Kit 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
HUAWEI ML Kit 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !

软件简介

这是华为机器学习服务(HUAWEI ML Kit)的示例代码, 通过此代码可以快速了解如何集成机器学习服务提供的各项能力,如人脸检测、文本识别、图像分割等服务

华为机器学习服务为您提供丰富的文本类、语音语言类、图像类和人脸人体类服务API,打造AI新体验,轻松构建您的AI应用。

服务介绍:

文本类

  • 文本识别:可以识别收据、名片、文档照片等含文字的图片,将其中的文本信息提取出来。
  • 文档识别:可以从含有文档的图片中,比如文章、合同等,能识别出带段落格式的文本信息。
  • 身份证识别:支持从带有身份证信息的图像或视频流中,识别出带格式的文本信息。
  • 银行卡识别:可以快速识别卡号信息,覆盖全球常见卡证类型,包括银联、美国运通、万事达(Mastercard)、Visa、JCB等。
  • 通用卡证识别:针对港澳通行证、香港身份证、回乡证等任意固定版式的卡证,基于文字识别技术,提供通用的开发框架,帮助开发者自定义后处理逻辑获取所需信息。
  • 表格识别:利用AI技术从输入的图片中识别并返回表格结构信息(包括单元格的行列信息和坐标信息)和表格中的文本信息(包括单元格内的文本内容)。

语音语言类

  • 在线文本翻译:支持将源语言文字通过云侧服务器翻译为目标语言文字。
  • 离线文本翻译:支持在下载离线模型后,可以在没有网络的情况下将源语言文字翻译为目标语言文字。
  • 在线语种检测:支持在线检测文本的语种,既支持检测单语种文本,也支持检测混合语种文本。
  • 离线语种检测:可以在没有网络的情况下检测出文本的语种,既支持检测单语种文本,也支持检测混合语种文本。
  • 实时语音识别:支持实时将短语音(时长不超过60秒)转换为文本。
  • 语音合成:支持在线将文字信息转换为语音输出,能够实时输出音频数据,并且提供丰富的音色以及可通过调整音量、语速从而使发音达到更加真实自然的效果。
  • 离线语音合成:支持下载离线模型后,即便在无网络环境下也可以将文字信息转换为语音。
  • 音频文件转写:可以将5小时内的音频文件转换成文字,支持输出标点符号,以及能够生成带有时间戳的文本信息,目前支持中英文的转写。
  • 个性化讲解视频生成:个性化讲解视频生成服务可以根据课件和讲解词自动生成讲解视频,降低视频制作过程中的投入成本,提高制作效率。
  • 实时语音转写:支持将输入的长语音(时长不超过5小时)实时转换为文本,支持输出标点符号,同时可以生成带有时间戳的文本信息。
  • 声音识别:支持通过在线(实时录音)模式检测声音事件,基于检测到的声音事件可以帮助开发者进行后续指令动作。

图像类

  • 图片分类:通过对图片中的实体对象添加标注信息,如:人、物、环境、活动、艺术形式等信息,帮助定义图片题材和适用场景等。
  • 对象检测和跟踪:您可以对图片中多个对象进行位置信息的跟踪与检测,基于此服务您可以实时定位和跟踪对象、对象分类等。
  • 地标识别:您会获得输入图片的地标名称、经纬度信息,基于获得的信息,您可以为用户创造更加个性化应用体验。
  • 图像分割:可以将图片中不同元素的内容分割出来。
  • 拍照购物:用户通过拍摄商品图片,在预先建立的商品图片库中在线检索同款或相似商品信息,返回相似商品ID和相关信息。
  • 图像超分辨率:提供1x和3x的超分功能,1x超分去除压缩噪声,3x超分不仅有效抑制压缩噪声,而且提供3倍的放大能力。
  • 文档校正:可以自动识别文档在图片中的位置,根据识别到的位置信息校正拍摄角度,同时支持用户自定义边界点位置进行文档校正,从而拍摄出文档正面图像。
  • 文字图像超分辨率:可以对包含文字内容的图片进行3倍放大,同时显著增强图像中文字的清晰度。
  • 场景识别:通过对图片的场景内容进行分类并添加标注信息,如:室外风景、室内场所、建筑物等,辅助理解图像内容。

人脸人体类

  • 人脸检测:支持检测人脸2D及3D轮廓。2D人脸检测能够识别人脸面部特征,包含表情、年龄、性别、穿戴等信息。3D人脸检测能够获取人脸关键点坐标信息、3D投影矩阵信息,以及人脸偏转角度等信息。
  • 人体骨骼检测:支持检测人体各部位关键点,能够返回关键点的人体骨骼位置数据,如:头顶、脖子、肩、肘、手腕、髋、膝盖、脚踝等。
  • 活体检测:支持不需要用户配合做动作即可识别业务场景中的用户是否为真人。
  • 手势识别:提供手部关键点识别和手势识别能力,支持检测21个手部关键点,返回关键点的位置数据。
  • 人脸比对:人脸比对服务通过识别并提取模板中的人脸特征,将模板人像和人脸图像进行高精度比对,输出相似度值,进而判断两者是否为同一个人。

自然语言处理类
文本嵌入:支持输入需要查询的中英文的词或句子,查询对应的向量值,并在此基础上做进一步研究。

自定义模型
自定义模型服务可以帮助您定制新的模型,您可以先通过模型开发在应用中快速训练和生成模型。生成后的模型可以随应用一起打包,也可以将其上传到ML Kit模型托管平台进行托管,通过ML Kit SDK实现模型的下载和更新。最后您可以使用ML Kit SDK,通过此自定义模型进行推理。

  • 端侧推理框架:是机器学习服务推出的便于集成开发运行到端侧设备上的机器学习推理框架,通过引入此推理框架,您能够最小成本的定义自己的模型并实现模型推理。
  • 模型开发:提供了迁移学习和模型转换能力,目前已经为您做好了模型训练的准备工作,方便您在应用程序中快速训练和生成新模型,通过此功能进行迁移学习和模型转换,不仅灵活度高,同时也降低了学习成本。
  • 模型部署与推理:机器学习服务支持将模型放在本地集成或通过云端托管模型,可以将模型随应用一起打包,也可以将其上传到ML Kit模型托管平台进行托管,通过ML Kit SDK实现模型的下载和更新。
  • 预置模型:是开发者根据机器学习服务指定的基础模型以重新训练的方式来获取新模型,也是机器学习服务提供的最简单的端到端自定义模型解决方案,当前提供了图片分类和文本分类预置模型。
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (0)

加载中
更多评论
发表了资讯
03/19 10:29

华为机器学习服务 5.2.0 版本发布

华为机器学习服务5.2.0版本已发布,主要更新内容 在线文本翻译服务新增支持保加利亚语、克罗地亚语在线翻译能力。 离线语种检测服务新增支持波斯语、拉脱维亚语、高棉语离线语种检测能力。 实时语音识别服务、音频文件转写服务、实时语音转写服务支持获取已支持语言的列表。 图像分割服务新增支持头发区域的识别。 详细版本更新说明可查看新特性介绍

1
5
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
2020/08/14 10:38

超简单集成HMS ML Kit 实现parental control

# 前言 ---   各位应用程序开发者有没有在后台收到过家长们的反馈? 希望能够提供一个开关,采取一些措施保护小孩的眼睛,因为现在小孩子的近视率越来越高,和他们长时间近距离盯着屏幕有很大的关系。最近有一个海外的客户通过集成了ML kit 实现了防范小朋友眼睛离屏幕过近,或者玩游戏时间过长的父母类控制类功能。 # 场景 ---   父母需要这个功能防止小朋友眼睛距离屏幕过近,或者小朋友看屏幕时间过长。 # 开发前准备 --...

0
0
发表了博客
2020/08/15 10:25

超简单集成HMS ML Kit 实现parental control

前言   各位应用程序开发者有没有在后台收到过家长们的反馈? 希望能够提供一个开关,采取一些措施保护小孩的眼睛,因为现在小孩子的近视率越来越高,和他们长时间近距离盯着屏幕有很大的关系。最近有一个海外的客户通过集成了ML kit 实现了防范小朋友眼睛离屏幕过近,或者玩游戏时间过长的父母类控制类功能。 场景   父母需要这个功能防止小朋友眼睛距离屏幕过近,或者小朋友看屏幕时间过长。 开发前准备 在项目级gradle里...

0
0
发表了博客
2020/07/01 11:45

超简单集成ML kit 实现听写单词播报

背景   相信我们大家在刚开始学习一门语言的时候都有过听写,现在的小学生学语文的时候一项重要的课后作业就是听写课文中的生词,很多家长们都有这方面的经历。不过一方面这种读单词的动作相对简单,另一方面家长的时间也很宝贵,现在市场上出现了很多xx课后听写的语音,这些播讲人将语文教材上的课后听写单词录好,给家长下载使用,不过这种录音不够灵活,如果老师今天额外留了几道不是课后习题中的单词,这部分的录音就不能...

0
0
发表了博客
2020/06/30 11:03

超简单集成ML kit 实现听写单词播报

# 背景   相信我们大家在刚开始学习一门语言的时候都有过听写,现在的小学生学语文的时候一项重要的课后作业就是听写课文中的生词,很多家长们都有这方面的经历。不过一方面这种读单词的动作相对简单,另一方面家长的时间也很宝贵,现在市场上出现了很多xx课后听写的语音,这些播讲人将语文教材上的课后听写单词录好,给家长下载使用,不过这种录音不够灵活,如果老师今天额外留了几道不是课后习题中的单词,这部分的录音就不...

0
0
2020/11/02 17:40

一文搞懂华为ML Kit数字人,超简单集成

## 一、数字人介绍 虚拟数字人是综合多模态AI能力,结合图像视觉、情绪生成、语音克隆、语义理解等多种AI技术,广泛应用于媒体新闻主播、金融客服、虚拟游戏等众多场景。 数字人在行业中的应用: ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201102170528490.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDcwODI0MA==,size_16,color_FFFFFF...

0
0
发表了博客
2020/11/04 13:55

一文搞懂华为ML Kit数字人,超简单集成

一、数字人介绍 虚拟数字人是综合多模态AI能力,结合图像视觉、情绪生成、语音克隆、语义理解等多种AI技术,广泛应用于媒体新闻主播、金融客服、虚拟游戏等众多场景。 数字人在行业中的应用: 二、HMS ML Kit数字人 HMS ML Kit数字人是依托华为公司强大的图像处理、语音合成、声音克隆、语义理解等AI核心技术,全新推出的综合多模态AI能力。面向教育、新闻、多媒体制作企业,提供高质量、低成本、创新体验的内容创作模式。对比其...

0
0
2020/12/22 10:15

一文轻松集成华为HMS ML Kit 表格识别服务

# 前言 问卷调查收集是最常见的社会调查的一种方法, 通常应于市场调查,信息收集等方面。但是庞大的问卷调查收集完了之后面对如此大量的数据该怎么录入,并将内容转换为电子文档呢?今天就为大家介绍通过集成华为HMS ML Kit表格识别服务来轻松实现表格录入功能。 # 应用场景 华为HMS ML Kit表格识别服务是利用AI技术从输入的图片中识别并返回表格结构信息(包括单元格的行列信息和坐标信息)和表格中的文本信息(包括单元格内的...

0
0
发表了博客
2020/12/24 15:19

一文轻松集成华为HMS ML Kit 表格识别服务

前言 问卷调查收集是最常见的社会调查的一种方法, 通常应于市场调查,信息收集等方面。但是庞大的问卷调查收集完了之后面对如此大量的数据该怎么录入,并将内容转换为电子文档呢?今天就为大家介绍通过集成华为HMS ML Kit表格识别服务来轻松实现表格录入功能。 应用场景 华为HMS ML Kit表格识别服务是利用AI技术从输入的图片中识别并返回表格结构信息(包括单元格的行列信息和坐标信息)和表格中的文本信息(包括单元格内的文本...

0
0
2019/04/09 16:40

加入自然语言处理Google拓展机器学习套件ML Kit

Google拓展了机器学习套件ML Kit的可应用情境,现在不仅提供图像辨识功能,开始加入自然语言处理,提供智能回复(Smart Reply)与文字语言识别两个新的API。 ML Kit是Google在2018的I/O大会上释出的人工智能SDK,目的是要降低行动应用程序使用人工智能的技术门坎,ML Kit被整合进行动应用程序开发平台Firebase,其提供了一系列开箱即用的API,开发者不需要拥有机器学习领域的知识,马上就可以为应用程序加入脸部辨识或是文字辨识...

0
0
2020/12/10 16:52

集成华为机器学习服务(ML Kit)轻松打造爆款小游戏

在刷朋友圈时,总会被一些有趣的小游戏刷屏。这些游戏操作简单,老少皆宜并且传播速度非常快,分分钟就霸屏朋友圈。你是否也想做出一款爆款有趣的小游戏呢?华为机器学习服务提供的人脸识检测、手部关键点识别功能可以帮助你实现。 Crazy Rockets——这款游戏集成人脸识检测、手部关键点识别功能。开发出两种玩法,一种是通过人脸的上下移动来控制火箭穿梭通过巨石阵。另一种是通过手势的上下移动来控制。两种方式都是通过检测人...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
0 评论
13 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部