【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
果然,有这一套。 腰肌劳损,本来就是小病。 但是这一...
Rust 必须是 Rust,有稳定版,内存安全,语法不那么混...
新西兰目前的it就业市场是这样 平均一个岗位1,00...
说实话我只在极少的机会里读过蔡澜的书,似乎就还是在全季酒店那...
一、内存分配器组件总览Go 语言的内存分配器包含内存管理单元...
我家里是干建材的,就自学了CAD,能画些简单的平面图。 干...