拼音组合


13

创建一个函数,该函数将一个拼音音节的字符串作为参数,并返回存在的组合的true,否则返回false。

用“ v”代表“ü”。

这是组合的完整列表。 http://www.pinyin.info/rules/initials_finals.html

例子

f("bu") == true
f("zheng") == true
f("nv") == true
f("ri") == true
f("cei") == false
f("ia") == false
f("kian") == false
f("qa") == false

请不要做诸如抓取网页或阅读输入法文件之类的事情以减少字符数。(如果这样做,那么数据的长度将计入字符数)。该代码高尔夫的目的之一就是了解如何简化规则。最短的代码获胜。


那类似的东西nar呢?:P
JiminP 2011年

1
仅作为注释,尽管示例中有说明,但我认为nvi这永远不是有效的组合。
rintaun

如果链接页面已经说出了»  此表中已省略er, «也不应包括在内吗?(毕竟,如果我没记错的话,那是一个数字;
Joey

Answers:


4

JavaScript 1.6中,503个 496 477字符

function g(s){return/^([bfmpw]?o|[yjqx]ua?n|[ln]ve?|ei?|y[aio]ng|w?[ae]ng?|w?ai?|wei|y?ao|y?ou|y[ai]n?|yu?e|[^aeiou]+u)$/.test(s)|(((k=6*("ccsszzdflmnprtbghkjqx".indexOf(s[0])+(f=s[1]=='h')))|(r="a.e.ai.ei.ao.ou.an.ang.en.eng.ong.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f+1))))<0?0:k>84?r>17^k<108:parseInt("009m2f00b8jb009m2f00b7r3009m2n00b8jj1dwcfz0000rtfjba4f1xgbnjfj01rz1uyfb1009nn61b37cv1uyfa5".slice(k,k+6),36)>>r&1)}

更具可读性(除非将代码分成几行,否则会出现错误):

function _g(s)
{
  f = s[1] == 'h'
  k = "ccsszzdfghjklmnpqrtxb".indexOf(s[0]) * 6
  k += 6 * f
  return /^(weng|[bfmp]?o|[yjqx]ua?n|[ln]ve?|[ae]i?|y[aeiu]|y[aio]ng|[ae]ng?|wang?|wai?|we[in]|w[ou]|y?ao|y?ou?|y[ai]n|yue)$/.test(s) | 
         !!(k >= 0 && (1 << "a.e.ai.ei.ao.ou.an.ang.en.eng.ong.u.ua.uo.uai.ui.uan.uang.un.i.ia.ie.iao.iu.ian.iang.in.ing.iong.u.ue".split('.').indexOf(s.slice(f + 1)) & parseInt("00j85300mh2v00j85300mgan00j85b00mh332rsovz0002cp00b8jj00b8jjqmlts000b8jjv2mkfz3uwo3jv203jz3pwvelqmlts000jbaq2m6ewvqmlts03pwvdp".slice(k, k + 6), 36)))
}

零初始情况加上一些一次性条件使用正则表达式进行测试。此后,该表被编码为一系列6位以36为底的数字(串联),每个初始声音一个。然后,查找使用一对indexOf调用和一个移位来选择正确的位。

针对组合表中的所有单元格进行了测试(填充的单元格测试为真,空的单元格测试为假)。

编辑:因为比较g–,k–,h–,j–,q–和z–具有正确/错误的密集块,所以用比较替换了基数36查找的36个字符。

编辑:重新安排了位测试,以避免不必要的!!并进一步压缩了正则表达式。


为什么需要一个!!?我不确定我是否理解您为什么需要双倍...
Peter Olson

使用它,返回值为0或1;没有它,则“ true”返回非零值,但不一定返回1。我的测试脚本正在验证,if (g(s) == (validList.indexOf(s) >= 0)其中on返回false 16 == true;我从“'真正'的真正含义是什么”角度进行了辩论,并将其保留。无论哪种情况,我都计划在今天晚些时候进行更改,将其!!替换1<<r&*parseInt为(或多或少),(parseInt>>r)&1以便return为1 我刮掉了两个字符。
DocMax 2011年

1

PHP,548个字符

当然,这可能不是最佳选择,但是我写了一个正则表达式来匹配有效的拼音组合。通过用变量替换重复的子字符串来减少字符。

<?php $a='?|e(i|ng?)';$b='|o(u|ng)|u';$c='|a?n)?|i(a[on]';$d='(a(ng?|o|i)';$e='|ng?)';$f='(i|ng)?';echo(preg_match("/^([bpm](a(i|o$e$a|u|o|i(e|a[on]$e?)|[pm]ou|m(e|iu)|f(a(ng?)?|ou$a|u)|d$d$a?$b(o|i$c?|e|u)?)|[dtnl]$d?|e$f$b(o$c|e)?)|[jqxy](i(a(o$e?|e|u|o?ng|n)|u(e|a?n))|([zcs]h?|r)i|[nl](ve?|i(n|ang?|u))|[dl]ia|[dt](ing|ui)|[dn]en|diu|([gkh]|[zcs]h?)(e(ng?)|a(o|ng?|i)?|ou|u(o|i|a?n)?)|r(e(ng?)?|a(o$e$b(a?n?|o|i)?)|[gkh](ei|ong|u(a$f))|[zcs]hua$f|([zcs]|[zc]h)ong|(z|[zs]h)ei|a(i|o$e?|ou$a?|w(u|a(i$e?|o|e(i$e))$/",$argv[1]))?"true":"false";

用法

> php pinyin.php bu
> true
> php pinyin.php cei
> false

1

F#,681个字符

type l=Y|J|Q|X|W|F|B|P|M|N|L|T|D|Z|K|H|Zh|G|Sh|Ch|C|S|R|Iong|Vn|Van|Ia|Iu|In|Iang|Ve|V|Ian|Iao|Ie|Ing|I|Ei|A|Ai|An|Ang|Eng|U|Ao|E|Ou|Uo|Uan|Un|Ui|En|Ong|Ua|Uang|Uai|Ueng|O
let v x=x.GetHashCode()
let n x=J.GetType().GetNestedType("Tags").GetFields().GetValue(v x).ToString().Substring(6).ToLower();
let(^)a b=List.collect(fun x->List.map(fun z-> n x+ n z)b)a
let(-)a b=[v a..v b]
let(&)a b=a@b
let(!)a=[v a]
[<EntryPoint>]
let main a=
 printf"%b"(List.exists(fun x->x=a.[0])(Y-X^Iong-I& !W^Ei-Ui@Ua-O& !F^Ei-A@An-U@ !Ou&(F-N@D-Sh)^ !En&F-M^ !O&B-M^ !In&N-L^Iu-Un& !D^Ia-Iu&B-D^Ian-Ao& !M^E-Ou&Ch-S^A-Ong&T-Sh^Ei-Ui&N-G^ !Ong&K-Ch^Ua-Uai& !R^An-Ua&(Sh-R@ !Z@ !Zh)^ !I&["lia";"pou";"mui"]))
 0

没有初始辅音正确(Y,W等),就不会得到音节。


1

APL(Dyalog扩展),475字节

s←⊢⊆⍨' '≠⊢
a b c2097144 131064 1957895
f←{(⊂⍵)∊(12v),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),(,⊤(a-8)1966080 393208 1966064 2096720 1966072 1048568a a 2056184a 131048a 7288b 7280 106488b 7280b 0 1958911 73735c c 352263c 24583 1859591c,57)/,('bpmfdtnlgkhzcs',s'zh ch sh r j q x')∘.,v'aoe',s'ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'}

在线尝试!

打高尔夫球。

不打高尔夫球

s←{⍵⊆⍨' '≠⍵}
cons'b p m f d t n l g k h z c s zh ch sh r j q x'
vwls'a o e ai ei ao ou an ang en eng ong u ua uo uai ui uan uang un ueng i ia ie iao iu ian iang in ing iong u ue uan un'
tabcon∘.,vwl
bin←,⊤2097136 1966080 393208 1966064 2096720 1966072 1048568 2097144 2097144 2056184 2097144 131048 2097144 7288 131064 7280 106488 131064 7280 131064 0 1958911 73735 1957895 1957895 352263 1957895 24583 1859591 1957895 7 7 7 7 7
all'aoe',(12vwl),(s'yi ya ye yao you yan yang yin ying yong yu yue yuan yun wu wa wo wai wei wan wang wen weng nv lv nve lve'),bin/,tab
f←{(⊂⍵)∊all}

在线尝试!

helper函数s解压缩以空格分隔的字符串:

{⍵⊆⍨' '≠⍵}    monadic function taking a string
    ' '≠⍵       0s at spaces, 1s elsewhere
 ⍵⊆⍨            Partition (split at 0s)

我首先将可能的初始和最终字符串存储在音节中,然后创建一个表,tab其中包含第一个列表中每个字符串与第二个列表中每个字符串的连接。

接下来,我将二进制数据存储为整数列表。一些整数是重复的,因此可以存储在变量中,这也允许省略一些空格。

每个整数都解码为二进制,并代表表的一行。数字中的每一位代表该行中的某个音节是否为有效音节,其中MSB代表第一列。从表格中删除所有无效的音节。

我们将表展平到一个列表中,作为特殊情况添加没有初始辅音的表格,最后检查我们的输入是否在列表中。

可能的进一步打高尔夫球潜力:

  • 编写base64或base255编码
  • 重新排列列和行以减小数字。

Python有用的脚本和测试用例生成器:在线尝试!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.