生物信息学中的迁移学习

点击量:17

摘要: 在使用机器学习处理一些实际场景中的任务时,往往会面临可获取的数据量不多的问题,而生物信息学就是这样的一个领域。生物信息学相关数据的样本量有限,而且往往样本正反例不平衡,主要为正例样本,并且数据的标注成本较高,而迁移学习技术使得在这样的条件下进行机器学习成为了可能。本文主要论述使用迁移学习进行生物信息学研究的可行性、有效性和重要性。

关键词: 生物信息学; 迁移学习

继续阅读“生物信息学中的迁移学习”

Windows安装CUDA和CUDNN运行环境

点击量:23

由于很多同学需要使用Windows系统进行GPU上的计算,比如运行TensorFlow或者Pytorch等,在Windows上正确安装CUDA和CUDNN则成了一个关键的问题。与在Linux上安装的整体流程类似,但是还有一些细节要注意,本文以Windows 10系统为例,进行CUDA环境的安装,并以TensorFlow验证安装的成功。

继续阅读“Windows安装CUDA和CUDNN运行环境”

科技力量是中国抗疫制胜的法宝

点击量:33

       摘要:2020年我们遭受到了新型冠状病毒肺炎疫情的袭击,幸运的是,高新技术为我们中国此次抗击疫情,提供了最先进的、最有力的武器,这是我们战胜疫情的法宝。包括疫情在内,人类战胜大灾大疫等重大突发危机事件,都离不开科学的发展,以及技术的创新。

       关键词:科技力量;抗疫;危机事件

继续阅读“科技力量是中国抗疫制胜的法宝”

几个免费开源的英文语音数据集

点击量:71

AI柠檬之前发布过一篇总结有哪些开源的中文语音数据集的文章(详见:几个最新免费开源的中文语音数据集),这里我将再总结一些免费开源的英文语音数据集,以方便大家做科研和工程时能够使用到。并且这里列举出的英文语音数据集可以确保能够下载和使用,并且是免费开源的,下载链接见文末。

继续阅读“几个免费开源的英文语音数据集”

基于动态软件体系结构的插件机制原理(C语言实现)

点击量:59

我们说软件体系结构的时候,常常说的是静态的体系结构。众所周知,静态的体系结构在运行的时候是不会发生结构上的变更的。而每当在结构上有变更的时候,比如给软件增加一个新的功能,新的模块,都需要重新编译相关的组件并部署。由于这个部署常常需要重启软件,这给一些软件的运行维护带来了极大的挑战,比如金融类的软件系统,正常情况下不能停止运行,哪怕数秒时间,否则会产生很多麻烦。而通过动态软件体系结构,使用可以“热插拔”的插件,我们就能够实现“给奔跑的汽车换零件”。

继续阅读“基于动态软件体系结构的插件机制原理(C语言实现)”

ASRT开源语音识别项目开始兼容TensorFlow 2.X

点击量:381

大约三周前,一位GitHub用户在ASRT开源语音识别项目提交了一个Issue,指出该项目不能运行于TensorFlow 2.X环境下,存在兼容问题。于是他上周向本项目提交了修改代码的Pull Request。经过本人实际测试,修改后的代码同时兼容TensorFlow 1.X版和2.X版,并且完全无错误正确运行。

继续阅读“ASRT开源语音识别项目开始兼容TensorFlow 2.X”

为什么说“家是最小国,国是千万家”

点击量:45

“家是最小国,国是千万家”,是一句耳熟能详的歌词,时常会在我们的耳边响起。从古至今,对于英雄或者做出了突出贡献的人们,我们也经常会提到一个词,那就是“家国情怀”。家国情怀是《礼记》里修身齐家治国平天下的人文理想,是《岳阳楼记》中“先天下之忧而忧,后天下之乐而乐”的大任担当,也是中国人的精神谱系里,国家与家庭、社会与个人的一种密不可分的整体思维。而这次疫情,让中国人的“家与国“,在社会中的各个角落里,体现得淋漓尽致。

继续阅读“为什么说“家是最小国,国是千万家””

[论文翻译]SpecAugment:一种用于自动语音识别的简单数据扩增方法

点击量:162

SpecAugment: A Simple Data Augmentation Method for Automatic Speech Recognition

原文:https://arxiv.org/abs/1904.08779

Daniel S. Park∗, William Chan, Yu Zhang, Chung-Cheng Chiu, Barret Zoph, Ekin D. Cubuk, Quoc V. Le

Google Brain

{danielspark, williamchan, ngyuzh, chungchengc, barretzoph, cubuk, qvl}@google.com

继续阅读“[论文翻译]SpecAugment:一种用于自动语音识别的简单数据扩增方法”

手把手教你从零开始搭建个人博客

点击量:308

曾有不少人问过我怎么搭建自己的博客。其实搭建一个个人的博客有很多种方式,有使用Git Page的,有使用一些博客平台的,也有自己购买网站空间或服务器搭建的,更有大神索性自己开发一套博客程序来用的。本文所介绍的方法全部基于Linux系统服务器和LEMP(即Linux、Nginx、Mysql和PHP),使用著名的WordPress程序进行安装搭建。

继续阅读“手把手教你从零开始搭建个人博客”

一场疫情悄悄告诉我们IT行业未来的三大趋势

点击量:372

2020年注定是不平凡的一年,1月份爆发的一场席卷全国的新型冠状病毒肺炎疫情,让我们黯然失色,谈毒色变,闻野生动物丧胆。往日本该热热闹闹的大街小巷,现在却冷冷清清,行人个个带起口罩,一听到咳嗽声就会下意识躲开。

继续阅读“一场疫情悄悄告诉我们IT行业未来的三大趋势”