分类
ASRT 应用开发 智能语音技术

ASRT上线测试Demo啦

点击量:54

ASRT项目最近新上线了Web网页端的测试Demo,以供各位测试ASRT最终的使用效果。测试地址为:https://asrt.ailemon.me/demo ,欢迎大家进行测试使用。开源的JavaWeb项目地址为:https://github.com/nl8590687/ASRT_SpeechClient_JavaWeb 。由于后端服务器的规模和性能限制,以及网络的延迟,可能存在着等待时间偏长的问题,请耐心等待,不要不停地点击识别按钮,会加重服务器负担。如果显示没有变化,可能是本身没录上音或者录音声音为空白噪声。

分类
应用开发

C#在UWP中实现录音功能

点击量:22

我们在开发Windows客户端程序时,有时需要实现录音的功能,比如使用语音识别时。本文中的代码通过DLL导入调用系统API实现了录制16kHz、16bit位宽的单声道wav格式录音。该代码已用于ASRT语音识别客户端SDK(C# UWP版):

https://github.com/nl8590687/ASRT_SpeechClient_UWP

分类
应用开发

C#基于winmm实现录音功能

点击量:29

我们在开发Windows客户端程序时,有时需要实现录音的功能,比如使用语音识别时。本文中的代码通过DLL导入调用系统API实现了录制16kHz、16bit位宽的单声道wav格式录音。该代码已用于ASRT语音识别客户端SDK(C# WPF桌面版):https://github.com/nl8590687/ASRT_SpeechClient_WPF

分类
应用开发

基于动态软件体系结构的插件机制原理(C语言实现)

点击量:85

我们说软件体系结构的时候,常常说的是静态的体系结构。众所周知,静态的体系结构在运行的时候是不会发生结构上的变更的。而每当在结构上有变更的时候,比如给软件增加一个新的功能,新的模块,都需要重新编译相关的组件并部署。由于这个部署常常需要重启软件,这给一些软件的运行维护带来了极大的挑战,比如金融类的软件系统,正常情况下不能停止运行,哪怕数秒时间,否则会产生很多麻烦。而通过动态软件体系结构,使用可以“热插拔”的插件,我们就能够实现“给奔跑的汽车换零件”。

分类
应用开发

转载:服务端高并发分布式架构演进之路

点击量:51

本文转载自segmentfault.com

https://segmentfault.com/a/1190000018626163

1. 概述

本文以淘宝作为例子,介绍从一百个到千万级并发情况下服务端的架构的演进过程,同时列举出每个演进阶段会遇到的相关技术,让大家对架构的演进有一个整体的认知,文章最后汇总了一些架构设计的原则。

特别说明:本文以淘宝为例仅仅是为了便于说明演进过程可能遇到的问题,并非是淘宝真正的技术演进路径

分类
应用开发

转载:架构整洁之道, 看这一篇就够了!

点击量:41

本文转载自微信公众号:阿里技术,作者:韩帅

https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247490231&idx=1&sn=b12ac5475855701c7d5ab73bb4d2b8c0

程序的世界飞速发展,今天所掌握的技能可能明年就过时了,但有些知识历久弥新,掌握了它们,你在程序的海洋中就不会迷路,架构思想就是这样的知识。
本文是《架构整洁之道》的读书心得,作者将书中内容拆解后再组织,不仅加入了个人的独到见解,而且用一张详细的知识脉络图帮助大家了解整本书的精华。如果你读过这本书,可以将本文当做一次思想交流,如果你还没看过这本书,更要阅读这篇文章,相信你会得到不同于以往的启发。

分类
ASRT Python学习笔记 应用开发

Python实现录音和播放功能

点击量:547

我们在需要跟用户使用语音进行交互的场景中,经常需要使用到录音的功能,比如网络语音通话和语音助手等,而完整的从底层实现录音功能往往是相当困难的,通常通过调用相关API来实现。这里我们介绍一种使用Python(3.x)中的PyAudio软件包来实现录音的方法。

分类
应用开发 数据结构和算法

C++ 常用STL库总结

点击量:1458

我们在使用C++开发相关软件、实现一些算法的时候,不可避免的会使用到STL标准库,本文对这个标准库常用的几种数据结构和算法库进行了整理。代码样例来自HowieMen,感谢。

分类
ASRT 应用开发 智能语音技术 模式识别 深度学习

ASRT:一个中文语音识别系统

点击量:51967

ASRT是一套基于深度学习实现的语音识别系统,全称为Auto Speech Recognition Tool,由AI柠檬博主开发并在GitHub上开源(GPL 3.0协议)。本项目声学模型通过采用卷积神经网络(CNN)和连接性时序分类(CTC)方法,使用大量中文语音数据集进行训练,将声音转录为中文拼音,并通过语言模型,将拼音序列转换为中文文本。算法模型在测试集上已经获得了80%的正确率。基于该模型,在Windows平台上实现了一个基于ASRT的语音识别应用软件,取得了较好应用效果。这个应用软件包含Windows 10 UWP商店应用和Windows 版.Net平台桌面应用,也一起开源在GitHub上了。

分类
应用开发 操作系统原理 数据结构和算法

C语言基于MPI并行计算矩阵的乘法

点击量:635

矩阵的计算是并行计算里的一个很重要的问题。矩阵是一种网格化的数据,是一组同类型数值的集合,矩阵的出现,使得代数系统更完善,对各种实际问题的求解产生了巨大的作用。但是其庞大的计算量往往令人生畏,稍微大一点的矩阵,计算就变得非常繁琐,不仅仅是人,而且串行计算的程序,也同样会变得非常缓慢。这时我们就需要并行计算来解决这些问题了。

本文使用分治思想,利用主从节点方式,实现了一个并行计算的矩阵相乘程序,并将结果跟串行程序做了对比,计算了其加速比。