现代汉语语音分析方法与流程-尊龙凯时官方app下载

文档序号:36404866发布日期:2023-12-16 10:54阅读:6来源:国知局
现代汉语语音分析方法与流程
现代汉语语音分析方法、系统及存储介质
技术领域
1.本发明涉及语音分析领域,具体而言,涉及一种现代汉语语音分析方法

系统及存储介质



背景技术:

2.现代汉语语音分析在语音识别中起着关键作用

通过分析和理解汉语语音的特征

音素和语音变化规律,可以开发出更准确和可靠的汉语语音识别系统

同时,汉语语音分析也是语言学研究的重要组成部分

通过对汉语语音的分析,可以探索和研究汉语的音系

音变规律

声韵调系统等语音学特征,这对于了解汉语的语音结构

语音演变以及与其他语言的比较研究都非常有价值

但是,对于现代汉语语音分析的过程中,经常会出现音素切分不清的情况,针对上述的问题,目前尚未提出有效的尊龙凯时官方app下载的解决方案



技术实现要素:

3.本发明实施例提供了一种现代汉语语音分析方法

系统及存储介质,通过构建语音拆解规则对预处理后的语音数据进行解析,以准确得到语音数据的声母

韵母及声调,提高现代汉语语音分析效率

4.根据本发明实施例的一个方面,提供了一种现代汉语语音分析方法,其包括以下步骤:
5.s1、
获取现代汉语语音数据;
6.s2、
对获取的现代汉语语音数据进行包括去除噪音

均衡化音频质量

提取声学特征及国际音标的识别与标记的预处理;
7.s3、
按照语音拆解规则对预处理后的语音数据进行解析,得到语音数据的声母

韵母及声调,具体包括:
8.s31、
按照语音拆解规则对预处理后的语音数据
p
进行解析,得到声调i及声母

韵母的组合
p1

9.i

(

《shengyun》([^0-9|

|

|

|

|

|

|

|

|

|
[0010]

])*)(

《intonation》([0-9|

|

|

|

|

|

|

|

|

|
[0011]

])*).matcher(p).group("intonation")

[0012]
其中,i为声调,数字
0—9、



















为不同格式的声调,
shengyun
为对声母

韵母组合的命名,
intocation
为对声调的命名,
p
为预处理后的语音数据,
matcher(p)
为输入语音数据,
group("intonation")
为输出声调;
[0013]
s32、
按照语音拆解规则对声母

韵母的组合
p1
进行拆分,得出声母c及韵母
v。
[0014]
作为一种可选的实施方式,所述步骤
s32、
按照语音拆解规则对声母

韵母的组合
p1
进行拆分,得出声母c及韵母v,具体为:
[0015]
s321、
判断
p1
是否为零声母,若为零声母,则按照第一声母拆解规则及第一韵母拆解规则分别对声母

韵母的组合
p1
进行解析,得到声母c及韵母v,解析结束,否则执行步骤
s322

[0016][0017]
其中,c为声母,
null
为对零声母的命名,
0、
分别为零声母的符号,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0018][0019]
其中,v为韵母,
null
为对零声母的命名,
0、
分别为零声母的符号,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0020]
s322、

p1
不为零声母,按照第二声母拆解规则及第二韵母拆解规则分别对
p1
进行解析,得到待定声母
c1
及待定韵母
v1

[0021]
c1

(

《consonant》(
国际音标辅音
)*)(

《vowel》(.)*).matcher(p1)
[0022]
.group("consonant")

[0023]
其中,
c1
为待定声母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0024]
v1

(

《consonant》(
国际音标辅音
)*)(

《vowel》(.)*).matcher(p1)
[0025]
.group("vowel")

[0026]
其中,
v1
为待定韵母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0027]
s323、
判断得到的待定韵母
v1
是否为空韵母,若
v1
不为空韵母,则确认之前得到的待定声母
c1
为需要的声母
c、
待定韵母
v1
为需要的韵母v,解析结束,否则执行步骤
s324

[0028]
s324、v1
为空韵母,则判断有没有声化韵,若有声化韵,则按照第三声母拆解规则及第三韵母拆解规则分别对待定声母
c1
进行解析,得到声母c及韵母v,解析结束,否则执行步骤
s325

[0029]c=
(

《consonant》(
国际音标辅音
)*)(

《vowel》(
声化韵
) )
[0030]
.matcher(c1).group("consonant")

[0031]
其中,c为声母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,声化韵为声化韵表中全部的辅音,
c1
为待定声母;
[0032]v=
(

《consonant》(
国际音标辅音
)*)(

《vowel》(
声化韵
) )
[0033]
.matcher(c1).group("vowel")

[0034]
其中,v为韵母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,声化韵为声化韵表中全部的辅音,
c1
为待定声母;
[0035]
s325、
没有声化韵,则声母c为零声母,韵母v为待定声母
c1
的值

[0036]
作为一种可选的实施方式,所述步骤
s1
中的现代汉语语音数据包括普通话语音数据及汉语方言语音数据

[0037]
作为一种可选的实施方式,所述步骤
s2
中对语音数据进行国际音标的识别与标记
能够通过人工标记

[0038]
作为一种可选的实施方式,所述步骤
s3
中语音拆解规则包括声调拆解规则

声母拆解规则及韵母拆解规则

[0039]
作为一种可选的实施方式,所述声母拆解规则包括第一声母拆解规则

第二声母拆解规则及第三声母拆解规则

[0040]
作为一种可选的实施方式,所述韵母拆解规则包括第一韵母拆解规则

第二韵母拆解规则及第三韵母拆解规则

[0041]
根据本发明实施例的又一方面,还提供了一种现代汉语语音分析系统,其包括:
[0042]
获取单元,用于获取语音数据;
[0043]
预处理单元,用于对语音数据进行预处理,所述预处理包括去除噪音

均衡化音频质量

提取声学特征及国际音标的识别与标记;
[0044]
创建单元,用于创建包括声调拆解规则

声母拆解规则及韵母拆解规则的语音拆解规则;
[0045]
解析单元,用于根据所述语音拆解规则对预处理后的语音数据进行解析,得到语音数据的声母

韵母及声调

[0046]
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述数据扩展方法

[0047]
本发明的有益效果:
[0048]
1、
本发明使用国际音标进行现代汉语语音数据的识别与标记,国际音标是一种用于表示人类语音音素的符号系统

它不受特定语言的限制,可以准确地表示各种语音音素及其发音方式

国际音标包含了广泛的符号,用于描述语音的音位

辅音

元音

调型等方面

拼音主要用于标注汉字的发音,特别是普通话中的发音,而国际音标则是一种更加通用的符号系统,用于描述各种语言的发音

与拼音相比,国际音标更加精确和具体,可以表示更多细致的发音差异,对于探索和研究汉语的音系

音变规律

声韵调系统等语音学特征,了解汉语的语音结构

语音演变以及与其他语言的比较研究,具有不可替代的作用;
[0049]
2、
本发明依据辅音为声母

元音

元音后面带的辅音为韵母

数字为声调的基本拆解原则,构建包括声调拆解规则

声母拆解规则及韵母拆解规则的语音拆解规则对预处理后的语音数据层层进行分解解析,并通过国际音标辅音表判断是否为空韵母,通过声化韵表判断是否有声化韵,最终得到需要的声母

韵母及声调,提高现代汉语语音分析效率

附图说明
[0050]
此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定

在附图中:
[0051]
图1是根据本发明实施例的一种现代汉语语音分析方法的流程图;
[0052]
图2是根据本发明实施例的一种可选的现代汉语语音分析系统的结构示意图;
[0053]
图3是根据本发明实施例的一种可选的按照语音拆解规则对声母

韵母的组合
p1
进行拆分的流程图

具体实施方式
[0054]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例

基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围

[0055]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序

应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施

此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程

方法

系统

产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程

方法

产品或设备固有的其它步骤或单元

[0056]
如附图1所示,本发明实施例提供了一种现代汉语语音分析方法,其包括以下步骤:
[0057]
s1、
获取现代汉语语音数据;
[0058]
现代汉语语音数据包括普通话语音数据及汉语方言语音数据

普通话作为现代汉民族共同语,在中国现代社会的交流

沟通中发挥着重要的作用,而方言是汉语的分支,是局部地区人们使用的语言,当前我国语言学界对现代汉语方言划分主要有十大方言,分别是官话

晋语

吴语

徽语

湘语

赣语

闽语

客语

粤语及平话

[0059]
本发明获取现代汉语语音数据,包括获取普通话语音数据及汉语方言语音数据

[0060]
s2、
对获取的语音数据进行预处理;
[0061]
对获取的语音数据进行预处理,包括去除噪音

均衡化音频质量及提取声学特征,还包括对语音数据进行国际音标的识别与标记,国际音标的识别与标记可以通过人工标记

[0062]
由于汉语语音系统与其他语言
(
英语等
)
存在较大的差异,目前并没有普遍可用的软件工具可以直接实现汉语语音的国际音标标记,所以目前进行汉语语音的国际音标标记还是用人工来完成,同时,机器标记也是本发明后面要继续进行的研发方向

[0063]
国际音标
(international phonetic alphabet
,缩写:
ipa)
:又称万国音标,是一种以拉丁字母为基础的标音系统,
19
世纪末由国际语音学学会设计以作为口语发音的标准表记形式,包括元音

辅音及声调

国际音标遵循“一音一符,一符一音”的原则

本发明使用国际音标进行现代汉语语音数据的识别与标记,国际音标作为一种用于表示人类语音音素的符号系统

它不受特定语言的限制,可以准确地表示各种语音音素及其发音方式

国际音标包含了广泛的符号,用于描述语音的音位

辅音

元音

调型等方面

汉语拼音主要用于标注汉字的发音,特别是普通话中的发音,而国际音标则是一种更加通用的符号系统,用于描述各种语言的发音

与拼音相比,国际音标更加精确和具体,可以表示更多细致的发音差异,对于探索和研究汉语的音系

音变规律

声韵调系统等语音学特征,了解汉语的语音结构

语音演变以及与其他语言的比较研究,具有不可替代的作用

[0064]
辅音:辅音
(consonant)
或称子音,是语音的一类,与元音相对,发音的调音环节中
气流在调音器官某一部分受到完全或部分阻碍

辅音的发音都可以分为三个阶段:成阻
——
持阻
——
除阻

这三个阶段的情况不同产生了不同的辅音

[0065]
元音:元音
(vowel)
又称母音,是音素的一种,与辅音
(
又称子音
)
相对

元音是在发音过程中由气流通过口腔而不受阻碍发出的音

发元音时,气流从肺部通过声门冲击声带,使声带发出均匀震动,然后震音气流不受阻碍地通过口腔

鼻腔,通过舌

唇的调节而发出不同的声音

[0066]
声调:声调
(tone)
的完整意义是一种附着于音节的高低抑扬
(
音调,或称音高
)。
语言学家赵元任从音阶获得灵感,设计了五度调值标记法,以数字1表示最低音

数字5表示最高音

赵氏五度标记法已获国际语音学学会认可,并成为国际音标标准之一

此五度标记法至今仍为最广泛使用的声调标记

要确定一个声调的调值,必须借助电子仪器来记录和分析

同样的音节被赋予不同的单字调,就可以表达不同的意义,比如现代标准汉语的妈
(m
ā
)、

(m
á
)、

(m
ǎ
)
和骂
(m
à
)
由同样的辅音和元音构成,却可以声调区辨其义

汉语音节的声调用国际音标标声调时,最好用的是调值数字表示法

[0067]
目前,声调的表示法有很多种类,有升降符号
(
箭头
)
的,有数字类型的
(
包括多位数字标示调值和只有一位数字标示调号
)
,还有些人数字会采用上标,还有采用
①‑⑨
表示的

为方便机器识别,本发明的步骤
s2
中人工对于国际音标的标记默认为用数字类型的字符“0-9”或
“①‑⑩”
来表示

[0068]
比如普通话,有4个声调,为阴平声

阳平声


(
读作“赏”)


去声

所以有用
1/2/3/4
声调调号标注,也有用第1调的调值
(
调值就是具体的声调高低的数值指标,有从1位数到多位数不等
。)

55
,第2调调值是
35
,第3调调值是
214
,第4调调值是
51
标注

普通话中用4个声调调值标注比如:
[0069]
第一声:
[fan55]

[0070]
第二声:茄
[0071]
第三声:炒
[0072]
第四声:
[tan51]

[0073]
用4个声调调号标注比如:
[0074]
第一声:
[fan1]

[0075]
第二声:茄
[0076]
第三声:炒
[0077]
第四声:
[tan4]

[0078]
比如粤方言,有9个声调,分别为:阴平

阴上

阴去

阴入
(
也称上阴入
)、
下阴入
(
也称中入
)、
阳平

阳上

阳去

阳入

粤方言的9个声调如果用调号标注,可以标记为
1—9
个数字,比如:
[0079]
[0080]
如果用调值标注,可以标注为比如:
[0081][0082]
所以有用声调调号
1-9

①‑⑨
标注,也有用调值
(
从1位数到多位数不等
)
标注

[0083]
s3、
按照语音拆解规则对预处理后的语音数据进行解析,得到语音数据的声母

韵母及声调,基本拆解原则为辅音为声母

元音

元音后面带的辅音为韵母

数字为声调,具体为:
[0084]
s31、
按照语音拆解规则对预处理后的语音数据
p
进行解析,得到声调i及声母

韵母的组合
p1

[0085]
本发明中,预处理后的语音数据
p
为一个语音的国际音标数据,比如,一个普通话的语音数据“番”,它的国际音标数据
p
为“fan55”,则需先拆分
p
得到声调i及声母

韵母的组合
p1。
而对于一句普通话,比如:“你好吗?”这句话需要按三个字分别拆分,首先是你,
p
就是“ni3”或“ni214”,然后就是按照语音拆解规则进行拆分声母

韵母及声调

[0086]
本发明的语音拆解规则包括声母拆解规则

韵母拆解规则及声调拆解规则,而声母拆解规则包括第一声母拆解规则

第二声母拆解规则及第三声母拆解规则,韵母拆解规则包括第一韵母拆解规则

第二韵母拆解规则及第三韵母拆解规则;其中:
[0087]
声调拆解规则为:
[0088]i=
(

《shengyun》([^0-9|

|

|

|

|

|

|

|

|

|
[0089]

])*)(

《intonation》([0-9|

|

|

|

|

|

|

|

|

|
[0090]

])*).matcher(p).group("intonation")
[0091]
其中,i为声调,数字
0—9、



















为不同格式的声调,
shengyun
为对声母

韵母组合的命名,
intocation
为对声调的命名,
p
为预处理后的语音数据,
matcher(p)
为输入语音数据,
group("intonation")
为输出声调

[0092]
按照声调拆解规则拆分出语音的国际音标
p
中的声调i后,再拆分得出声母

韵母的组合
p1

[0093]
p1

(

《shengyun》([^0-9|

|

|

|

|

|

|

|

|

|
[0094]

])*)(

《intonation》([0-9|

|

|

|

|

|

|

|

|

|
[0095]

])*).matcher(p).group("shengyun")
[0096]
其中,
p1
为声母

韵母的组合,
shengyun
为对声母

韵母组合的命名,数字
0—9、



















为不同格式的声调,
intocation
为对声调的命名,
p
为预处理后的语音数据,
matcher(p)
为输入语音数据,
group("shengyun")
为输出声母

韵母的组合

[0097]
s32、
按照语音拆解规则对声母

韵母的组合
p1
进行拆分,得出声母c及韵母v,如附图3所示,具体为:
[0098]
s321、
判断
p1
是否为零声母,若为零声母,则按照第一声母拆解规则及第一韵母拆解规则分别对声母

韵母的组合
p1
进行解析,得到声母c及韵母v,解析结束,否则执行步骤
s322

[0099]
先判断国际音标里面有没有零声母的符号
(
比如零声母的标注惯例为
0、0、
三者之一的符号
)
,有零声母的符号就为零声母,若有零声母,按照第一声母拆解规则及第一韵母拆解规则分别对
p1
进行解析,分别得到声母c及韵母v,
[0100]
第一声母拆解规则为:
[0101][0102]
其中,c为声母,
null
为对零声母的命名,
0、
分别为零声母的符号,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0103]
第一韵母拆解规则为:
[0104][0105]
其中,v为韵母,
null
为对零声母的命名,
0、
分别为零声母的符号,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0106]
判断
p1
若为零声母,则按照第一声母拆解规则及第一韵母拆解规则分别对声母

韵母的组合
p1
进行解析,得到声母c及韵母v,解析结束,否则执行步骤
s322。
[0107]
s322、
在步骤
s321
中,经判断
p1
中没有零声母符号后,则正常拆分声母和韵母,按照第二声母拆解规则及第二韵母拆解规则分别对
p1
进行解析,得到待定声母
c1
及待定韵母
v1

[0108]
第二声母拆解规则为:
[0109]
c1

(

《consonant》(
国际音标辅音
)*)(

《vowel》(.)*).matcher(p1)
[0110]
.group("consonant")

[0111]
其中,
c1
为待定声母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0112]
第二韵母拆解规则为:
[0113]
v1

(

《consonant》(
国际音标辅音
)*)(

《vowel》(.)*).matcher(p1)
[0114]
.group("vowel")

[0115]
其中,
v1
为待定韵母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0116]
如下表1的国际音标辅音表,因为只有辅音会组成声母,所以根据表1找出
(
拆完
)
声母后,剩下的就是韵母;如果没有剩下的
(
待定韵母
v1
的值为空
)
,就为空韵母;
[0117]
表1:国际音标辅音表
[0118][0119]
s323、
判断步骤
s322
中得到的待定韵母
v1
是否为空韵母,若
v1
不为空韵母,则确认之前得到的待定声母
c1
及待定韵母
v1
即为需要的声母c及韵母v,解析结束,否则执行步骤
s324

[0120]
s324、

v1
为空韵母,则判断有没有声化韵,若有声化韵,则按照第三声母拆解规则及第三韵母拆解规则对待定声母
c1
进行解析,得到声母c及韵母v,解析结束,否则执行步骤
s325

[0121]
没有韵母则接着判断有没有声化韵,如下表2的声化韵表,所以根据表2找出声化韵辅音,有,按照第三声母拆解规则及第三韵母拆解规则对待定声母
c1
进行解析,得到需要的声母c及韵母
v。
[0122]
表2:声化韵表
[0123]
第三声母拆解规则为:
[0124]c=
(

《consonant》(
国际音标辅音
)*)(

《vowel》(
声化韵
) ).matcher(c1).group("consonant")

[0125]
其中,c为声母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,声化韵为声化韵表中全部的辅音,
c1
为待定声母;
[0126]
第三韵母拆解规则为:
[0127]v=
(

《consonant》(
国际音标辅音
)*)(

《vowel》(
声化
[0128]

) ).matcher(c1).group("vowel")

[0129]
其中,v为韵母,
consonant
为对声母的命名,国际音标辅音为国际音标辅音表中全部的辅音,
vowel
为对韵母的命名,声化韵为声化韵表中全部的辅音,
c1
为待定声母;
[0130]
s325、
若没有声化韵,则确认声母c为零声母,输出为
0、
中之一,韵母v=
c1

[0131]v=
c1

(

《consonant》(
国际音标辅音
)*)(

《vowel》(.)*)
[0132]
.matcher(p1).group("consonant")。
[0133]
其中,v为韵母,
c1
为待定声母,
consonant
为对声母的命名,国际音标辅音为国际
音标辅音表中全部的辅音,
vowel
为对韵母的命名,
p1
为声母

韵母的组合;
[0134]
下面,以一个普通话的语音数据“番”(p

fan55)
为解析的例子:
[0135]
p

fan55
[0136]
按照语音拆解规则中的声调拆解规则,得到:
[0137]i=
(

《shengyun》([^0-9|

|

|

|

|

|

|

|

|

|
[0138]

])*)(

《intonation》([0-9|

|

|

|

|

|

|

|

|

|
[0139]

])*).matcher("fan55").group("intonation")

55
[0140]
p1

(

《shengyun》([^0-9|

|

|

|

|

|

|

|

|

|
[0141]

])*)(

《intonation》([0-9|

|

|

|

|

|

|

|

|

|
[0142]

])*).matcher("fan55").group("shengyun")

fan
[0143]
对声母

韵母的组合
p1
进行拆分,经判断,无零声母符号
0、
或则按照第二声母拆解规则及第二韵母拆解规则对
p1
进行解析,得到待定声母
c1
及待定韵母
v1

[0144]
待定声母
c1

(

《consonant》(
国际音标辅
[0145]

)*)(

《vowel》(.)*).matcher("fan").group("consonant")
=f[0146]
待定韵母
v1

(

《consonant》(
国际音标辅
[0147]

)*)(

《vowel》(.)*).matcher("fan").group("vowel")

an
[0148]
判断得到的待定韵母
an
不为空韵母,则确认之前得到的待定声母
c1
及待定韵母
v1
即为需要的声母c及韵母v:
[0149]
即得出声母c为f,韵母v为
an
,声调i为
55
,解析结束,
[0150]
根据本发明实施例的另一个方面,本发明还提供一种现代汉语语音分析系统,如附图2所示,其包括:
[0151]
获取单元
101
,用于获取现代汉语语音数据,包括获取普通话语音数据及方言语音数据

[0152]
预处理单元
102
,用于对语音数据进行预处理包括去除噪音

均衡化音频质量及提取声学特征,还包括对语音数据进行国际音标的识别与标记,国际音标的识别与标记可以通过人工标记

[0153]
创建单元
103
,用于创建包括声调拆解规则

声母拆解规则及韵母拆解规则的语音拆解规则;本发明的语音拆解规则包括声调拆解规则

声母拆解规则及韵母拆解规则,而声母拆解规则包括第一声母拆解规则

第二声母拆解规则及第三声母拆解规则,韵母拆解规则包括第一韵母拆解规则

第二韵母拆解规则及第三韵母拆解规则

[0154]
解析单元
104
,用于根据语音拆解规则对预处理后的语音数据进行解析,得到语音数据的声母

韵母及声调

[0155]
作为一种可选的实施方式,上述获取单元
101
用于获取现代汉语语音数据的方式具体可以为:
[0156]
获取的现代汉语语音数据可以为音频或视频,电脑
、pad、
手机等终端都可实现语音或视频的采录获取;也可以多点多人同时开展获取工作,该单元能够提供用户友好的界面,根据用户需求自定义调查内容;实现分条目录制音频

视频功能

让语言研究工作者能够方便地录入语音数据和相关信息,并添加描述性元数据,如说话者信息

语言

方言等

所有获取调查内容存储于网络终端,减少对个人电脑的依赖,且在任何地方都可以登录查询;
简洁的采录获取界面,引导清晰,减少对发音人的干扰;实时上传服务器或录制后单独上传;有语音备注的在采录时会自动播放,用以指导调查;多种获取采录方式方便采录工作

[0157]
作为一种可选的实施方式,上述预处理单元
102
,用于对语音数据进行预处理包括去除噪音

均衡化音频质量及提取声学特征,还包括对语音数据进行国际音标的识别与标记的方式具体可以为:
[0158]
系统能够对上传的语音数据进行处理,包括声音信号的预处理和转换

这包括去除噪音

均衡化音频质量

提取声学特征等步骤

预处理还包括对语音数据进行国际音标的识别与标记,国际音标的识别与标记可以用人工方式进行

系统内可以对于专业校对标注人员设有信息登记库,存储专业校对标注人员基础信息:姓名,性别,出生年月,文化程度,职业,照片,工作单位,联系电话

国际音标标记也可以支持多人同时标记,标记内容相互独立;也可以设定是否看到对方的标记;可以设置导入相似标记的标准作为参考等多种标记功能,可以减轻标记过程的重复工作,另外,也可以扩展在教学中的应用,比如同一个语音分配给多个学生进行标记,标记完了可以同时显示所有同学的标记,并于语音数据拆分后,高亮显示标记不同的调查项,快速复盘学生标记差异原因

[0159]
作为一种可选的实施方式,上述创建单元
103
,用于创建包括声调拆解规则

声母拆解规则及韵母拆解规则的语音拆解规则的方式具体可以为:
[0160]
依据基本拆解原则:辅音为声母

元音

元音后面带的辅音为韵母

数字为声调

系统创建的语音拆解规则包括声调拆解规则

声母拆解规则及韵母拆解规则,而声母拆解规则包括第一声母拆解规则

第二声母拆解规则及第三声母拆解规则,韵母拆解规则包括第一韵母拆解规则

第二韵母拆解规则及第三韵母拆解规则,存储于系统内以备调用

[0161]
作为一种可选的实施方式,上述解析单元
104
用于根据语音拆解规则对预处理后的语音数据进行解析,得到语音数据的声母

韵母及声调的方式具体可以为:
[0162]
按照语音拆解规则对预处理后的语音数据
p
进行解析,得到声调i及声母

韵母的组合
p1
;按照语音拆解规则对声母

韵母的组合
p1
进行拆分,得出声母c及韵母v;判断
p1
是否为零声母,若为零声母,则按照第一声母拆解规则及第一韵母拆解规则对预处理后的语音数据进行解析,得到声母c及韵母v,解析结束;若经判断
p1
中没有零声母符号
(
比如
0、
中的三者之一
)
后,则正常拆分声母和韵母,按照第二声母拆解规则对
p1
进行解析,得到待定声母
c1
;按照第二韵母拆解规则对
p1
进行解析,得到待定韵母
v1
;判断得到的待定韵母
v1
是否为空韵母,若
v1
不为空韵母,则确认之前得到的待定声母
c1
及待定韵母
v1
即为需要的声母c及韵母v,解析结束;若
v1
为空韵母,则判断有没有声化韵,若有声化韵,则按照第三声母拆解规则及第三韵母拆解规则对待定声母
c1
进行解析,得到声母c及韵母v,解析结束;步骤
s25、
若没有声化韵,则确认声母c为零声母,输出为
0、
中之一;韵母v=
c1。
[0163]
根据本发明实施例的又一个方面,本发明还提供一种计算机可读的存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述任一项中所述的方法实施例中的步骤

[0164]
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
[0165]
s1、
获取现代汉语语音数据;
[0166]
s2、
对获取的现代汉语语音数据进行预处理;
[0167]
s3、
按照语音拆解规则对预处理后的语音数据进行解析,得到语音数据的声母

韵母及声调

[0168]
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘

只读存储器
(read-only memory

rom)、
随机存取器
(random access memory

ram)、
磁盘或光盘等

[0169]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣

[0170]
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中

基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备
(
可为个人计算机

服务器或者网络设备等
)
执行本发明各个实施例所述方法的全部或部分步骤

[0171]
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述

[0172]
在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现

其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行

另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式

[0173]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上

可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的

[0174]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中

上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现

[0175]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围

当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图