分类
ASRT 后端开发 应用开发 深度学习

深度学习模型最佳部署方式:用Python实现HTTP服务器作API接口

点击量:172

    当训练和测试完成一个深度学习模型之后,如果我们打算将这个算法模型上线,投入生产环境部署使用,那么我们就需要做一些额外的处理工作。由于深度学习模型对于算力需求较大,在上线过程中,一般有减小网络规模、使用专用硬件和通过C/S架构联网进行云端计算这三种方式。AI柠檬博主推荐使用第三种方式,即模型部署于服务器端,客户端通过网络将输入数据发送至服务器,计算得结果后传递给客户端。5G时代就在眼前,IPv6协议大规模部署,万物即将互联,尤其是无线移动互联网作为重要的基础设施是大势所趋。通过联网,即使是成本最低的低端的硬件,也可以在不损失精度的情况下,能够以更快的速度得到深度学习模型的计算结果。例如,ASRT语音识别系统就是以这种方式进行模型的部署的,已经能够为AI柠檬网站提供语音识别服务,用于语音搜索等任务。

分类
ASRT 智能语音技术

教你如何使用ASRT部署中文语音识别API服务器

点击量:1028

ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统在测试和生产环境中部署中文语音识别API服务器。文本以CPU (Intel x86_64) + Linux + Python 3 + Nginx 为示例运行环境。

分类
ASRT 智能语音技术

教你如何使用ASRT训练中文语音识别模型

点击量:2199

ASRT是一个中文语音识别系统,由AI柠檬博主开源在GitHub( https://github.com/nl8590687/ASRT_SpeechRecognition )上,为了便于大家使用,本文将手把手按顺序教你如何使用ASRT语音识别系统训练一个中文语音识别模型。

首先到GitHub上打开ASRT语音识别项目仓库:https://github.com/nl8590687/ASRT_SpeechRecognition

国内Gitee镜像地址:https://gitee.com/ailemon/ASRT_SpeechRecognition

打开的网页如图所示

分类
机器学习 深度学习

如何解决神经网络训练时loss不下降的问题

点击量:64604

当我们训练一个神经网络模型的时候,我们经常会遇到这样的一个头疼的问题,那就是,神经网络模型的loss值不下降,以致我们无法训练,或者无法得到一个效果较好的模型。导致训练时loss不下降的原因有很多,而且,更普遍的来说,loss不下降一般分为三种,即:训练集上loss不下降,验证集上loss不下降,和测试集上loss不下降。这里,首先默认各位都能理解过拟合和欠拟合的概念,如果有不清楚的可以参考下面的一些文章。

分类
ASRT 后端开发 智能语音技术 模式识别 深度学习

ASRT:一个中文语音识别系统

点击量:53993

ASRT是一套基于深度学习实现的语音识别系统,全称为Auto Speech Recognition Tool,由AI柠檬博主开发并在GitHub上开源(GPL 3.0协议)。本项目声学模型通过采用卷积神经网络(CNN)和连接性时序分类(CTC)方法,使用大量中文语音数据集进行训练,将声音转录为中文拼音,并通过语言模型,将拼音序列转换为中文文本。算法模型在测试集上已经获得了80%的正确率。基于该模型,在Windows平台上实现了一个基于ASRT的语音识别应用软件,取得了较好应用效果。这个应用软件包含Windows 10 UWP商店应用和Windows 版.Net平台桌面应用,也一起开源在GitHub上了。

分类
Python学习笔记 程序设计

转载:如何让 python 处理速度翻倍?内含代码

点击量:5

本文转载自:机器之心 · 阿里技术

https://www.jiqizhixin.com/articles/2019-12-25-2

阿里妹导读:作为在日常开发生产中非常实用的语言,有必要掌握一些python用法,比如爬虫、网络请求等场景,很是实用。但python是单线程的,如何提高python的处理速度,是一个很重要的问题,这个问题的一个关键技术,叫协程。本篇文章,讲讲python协程的理解与使用,主要是针对网络请求这个模块做一个梳理,希望能帮到有需要的同学。

分类
生活点滴

AI柠檬网站重启IPv6网络协议支持

点击量:9

一些细心的小伙伴们最近可能会发现,AI柠檬主要的网站时隔不到一年重新开始支持IPv6协议了。这一回,再次启动对IPv6的支持之后应该就不会去掉了,因为国内以及全球IPv6推进的进程已经加快,如今大多数云服务器和云产品都已经基本支持,不论今后如何维护服务器,这一点不会有太大变化了。

分类
学界业界动态 智能语音技术

10分钟标注数据胜过一年前的960h数据,FAIR新研究取得语音识别大进展(模型已开源)

点击量:98

近日,来自 FAIR 的研究者提出结合自训练和无监督预训练执行语音识别任务,证明这两种方法存在互补性,并取得了不错的结果。

来自机器之心翻译,有修改 https://www.jiqizhixin.com/articles/2020-11-05-10

自训练和无监督预训练已经成为使用无标注数据改进语音识别系统的有效方法。但是,我们尚不清楚它们能否学习类似的模式,或者它们能够实现有效结合。

最近,Facebook 人工智能研究院(FAIR)一项研究显示,伪标注和使用 wav2vec 2.0 进行预训练在多种标注数据设置中具备互补性。

只需来自 Libri-light 数据集的 10 分钟标注数据和来自 LibriVox 数据集的 5.3 万小时无标注数据,该方法就能在 Librispeech clean 和 other 测试集上取得 3.0%/5.2% 的 WER(词错率),甚至打败了仅仅一年前的基于 960 个小时标注数据训练的最优系统。在 Librispeech 所有标注数据上训练后,该方法可以达到 1.5%/3.1% 的词错率。

分类
ASRT 应用开发 程序设计

ASRT项目发布Python版SDK啦

点击量:52

       ASRT项目最近新上线了Python3版的SDK,并在GitHub与国内的Gitee上同步开源,以方便各位使用Python直接测试ASRT最终的使用效果,欢迎大家使用。开源项目地址为:

https://github.com/nl8590687/ASRT_SDK_Python3

https://gitee.com/ailemon/ASRT_SDK_Python3

       大家也可以直接接入使用AI柠檬部署的ASRT语音识别服务API接口,详见ASRT语音识别项目文档( https://asrt.ailemon.me/docs/ )。由于后端服务器的规模和性能限制,以及网络的延迟,可能存在着等待时间偏长的问题,请耐心等待。

分类
ASRT 智能语音技术

Python复现谷歌SpecAugment数据增强算法

点击量:99

       谷歌在2019年提出了用于语音识别数据增强的SpecAugment算法,基本原理是对频谱图进行各种遮盖,例如横向进行频率范围遮盖,以及纵向进行时间段遮盖,也可以将二者组合起来,如图所示。本文将以代码来介绍在实际应用中如何复现SpecAugment算法,并介绍如何将该代码应用到AI柠檬的ASRT语音识别系统( https://github.com/nl8590687/ASRT_SpeechRecognition )的训练中。

分类
综合技术 评论型文章

为什么每个在计算机行业的人都应当坚持经营一个自己的博客

点击量:62

       毕竟确实是有用的!每写一篇技术博客都是对自己技术学习的督促,也是对自己实际写作能力的考验,更是对自己独立思考和逻辑思维能力的锻炼。“天下文章一大抄”,还有“天下代码一大抄”,在互相抄来抄去的时代,能够自己原创写作,写出好文章,与自己原创从头一点一点编写好代码是一样的。有条件的话可以买一个自己的域名和服务器搭建独立博客,独立博客是自己的专属天地,如同自己的家一般,这里的一切规则由自己喜好主导,页面排版如何展示也自己说了算!在写博客前后,跟读者的交流也是自己的创意和想法的来源,如果自己有什么项目作品,博客还是发布自己的作品的绝佳平台!

分类
智能语音技术 机器学习

看懂语音识别中CTC解码器的原理,这篇文章就够了

点击量:170

在DNN-HMM架构的语音识别系统的声学模型中,训练一个DNN模型通常需要先进行帧和标签的对齐操作,此时需要先使用GMM通过EM算法不断迭代实现。而且隐马尔可夫假设一直饱受诟病,随着深度学习的发展,尤其是基于CTC的CNN和RNN模型的出现,使得实现端到端的语音识别声学模型成为了可能。CTC由于其强大的在时间序列上进行标签自动对齐的能力,可被用于语音识别、图像验证码(或者文本)识别和视频手势识别(手语识别)等问题中。

分类
综合技术

我是如何搭建NAS私有云服务器的

点击量:42

       熟悉AI柠檬博主的可能会知道,博主除了有搭建在公有云(阿里云和腾讯云等)上的博客和ASRT语音识别项目相关的网站等服务外,还在自己的局域网里搭建了一个物理的私有云服务器,用于个人数据文件的存储,以及一些计算的需求。并且,私有云上的部分服务也是可以通过公网访问的,而且部分公网上的服务也依赖于我的私有云,这样解决了数据存储安全性、数据访问便捷性和综合成本的节约的问题。或许你也需要一套这样的混合云解决方案!

分类
机器学习 深度学习

一文看懂循环神经网络基本原理

点击量:67

RNN是循环神经网络的缩写,并且也是循环网络结构中的一种,我们通常使用这种网络模型来处理序列型的数据。语音识别处理的就是一个典型的有时间顺序的序列数据,自然语言文本也是。在一个普通的DNN网络中,层与层之间是全连接的,而每层中的神经元节点之间不存在任何连接,这样的一种普通DNN网络结构难以解决很多问题。以语音识别为例,不同时刻t的语音包含的字,在推理计算时,需要根据上下文来确定应该输出为什么字符,而且结果应当跟具体所在时刻t无关,否则会出现不同时间说相同的字会产生不同的识别输出的问题。

    循环网络就解决了这个问题,这有点类似于隐马尔可夫模型,对于每一时刻的输入,所产生的输出值,不仅仅依赖于当前时刻t,还依赖于前N个时刻的输出值。这主要是通过在每一个循环层单元中,添加了一个记忆单元实现的。