赛博马工作室
Google

词句输入法

版本2.1

2016年2月29日

前言:

  词句输入法 是 专门 为 输入 词式文本 打造 的 输入法。 同时,对于 输入 传统文本 来说,也 不失为 一款 创新、高效 的 输入法。

  什么 是 词式文本? 本文 的 行文格式 就是! 为什么 要 提倡 词式文本? 我的 博客  有 专栏《有关语言文字d思考》 论述。 在此,我 只 强调 一点:概念 是 我们 认知 客观世界 的 基本 元素,语言、文字 中的 词 就是 概念的 标识符。 字 词 不分,以 字义 的 组合 代替 词(或者说,把 认识 世界 的 元素 替换成 字义),必然 导致 概念 模糊,思维 不清。 词式文本 有利于 克服 汉字的 这一 缺陷,确立 词 在 语言/文字 中的 中心 地位,使得 我们 能够 直面 概念,重视 概念,从而 提高 我们的 思维能力。

  思维能力 主要 由 抽象能力 和 逻辑能力 这 两个 部分 组成。 抽象能力 就是 从 纷繁复杂的 事物 现象 中 抽取 模式,形成 和 把握 概念 的 能力,而 逻辑能力 则 是 基于 已知的 概念 体系 进行 由此及彼的 推理。 前者 是 创新的 源泉 和 思维 进化 的 动力 所在; 后者 是 思维 正确性 的 保证。 最近的一则 消息 就是 这个 智力构成 的 最好见证——谷歌的 计算机程序 AlphaGo 战胜了 人类 围棋 职业二段 棋手! AlphaGo 与 过去的 计算机 人工智能 程序(比如 IBM 的 国际象棋 程序 深蓝) 相比,其 不同之处 就 在于 加入了 模拟 神经网络 的 深度学习(Deep learning)算法,使之 具备了 能够 自主 形成 对 各种 盘面 布局 的 优劣 (直觉)判断。 也就是说,具备了 抽象思维 的 能力。 直观地说,人工智能 下棋 程序 从 原来的 纯粹 逻辑 的 暴力搜索 进化 成了 类似 人类 那样的 依靠 直觉 来 下棋,而且 能 不断地 自我 提高。 尽管,相比于 人类,这 还 只是 在 一个 非常 狭小的 认知空间 中 实现 抽象思维 能力,但 这 却是 人工智能 质变 的 标志。 套用 登月宇航员 ·阿姆斯特朗 的 一句话: AlphaGo 的 一小步,(机器)人类 的 一大步! 从此,人工智能 将会 长足进步。

  最后,再次 借用 ·阿姆斯特朗 的 话 来 说明 词式文本 的 意义:实践 词式文本,只是 改变 我们 书写习惯 的 小小 一步,但 却 可能 是 改变 我们 思维习惯 的 大大 一步。 用 词句输入法 来 输入 词式文本,值得尝试! 

 

特点:

  1. 既 可以 输入 词式文本 也 可以 输入 传统文本。 可以 通过 菜单 或者 输入法 设置 选择 词式文本/非词式文本图片在这

  2. 基于 微软 文本服务框架(TSF),适用 于 Windows XP SP3、Windows 7、Window 8.1 和 最新的 Windows 10 操作系统。

  3. 可以 输入 超长 句子 (长度 可以 达到 100个 汉字),而 其它 主流 输入法 的 句子 长度 一般 限制在 20个 汉字 左右。

  4. 汉字、英文字母、数字 混合 输入

  5. 在 输入 过程 中,具备 简单的 编辑(删除、插入 汉字) 功能。

  6. 汉字 上屏 由 标点符号 以及 回车键 担当。

  7. 自动 区分 小数点 符号 和 中文的 句号: 紧接着 数字 符号 后面 输入 “.” 将 不作为 句号“。”,而是 作为 小数点 符号。 如果 要 在 数字 后面 输入 “。”,必须 连着 打 两个 “.”。

  8. 提倡 姓名 专有 形式,姓氏 后面 或 名字 前面  输入 “·”。 如果 在 姓氏 后面 输入 “·”,词句输入法 可以 自动 将 姓氏 候选词 的 优先度 提前。

下载
词句输入法 安装文件
 

运行环境:

  支持 32位、64位 Windows XP(sp3)、Windows Vista、Windows 7、Windows 8(包括 桌面、Metro)以及 最新的 Windows 10 操作系统。 注:对于 Windows XP(sp3),安装 词句输入法 之前 必须 先 启用 “将 高级-文字-服务-支持 应用于 所有 程序”选项图片在这
 

操作说明:

为了 方便 叙述,首先 约定 两个 基本概念:待定词词库词

  • 待定词:用户 输入 的 一组 连续的 (中间 没有 空格、“-”、“·” 等 符号 分割 的) 拼音编码 所 自动/挑选 呈现 的 词。 限定 长度  不得 超过 12个 汉字。  一般 常用词 的 长度 在 1~4 个 汉字 范围 内,但是 成语、典故、俚语、专用名词  等 可以 作为 一个 整体 连续 书写。 比如:中华人民共和国

  • 词库词:词库(包括 用户词库) 中 挑选 出来的 词。 用户 输入的 待定词 并不 一定  在 词库 中 存在。 这种 情况 下,词句输入法 程序 自动呈现的 待定词 按照 最少-组合 原则,由 词库 中 能够 找到 的 词 组合而成。

  1. 拼音编码:全拼、简拼 以及 模糊拼音图片在这 兼顾。 唯一 不同的 是 没有 隔音符号, '  键 被 用作 标点符号  ‘  和  ’ 。 类似 “yuan”(元) 与 “yu'an”(预案) 的 区别 通过 切换组合 来 实现。

  2. 上屏键: 句号(。)、逗号(,)、问号(?)、感叹号(!)、等号(、)分号(;)、括号(()【】{}) 以及 回车键。 特例:

    • 对于 单引号 和 双引号,如果 左引号 在 句首,则 右引号 上屏。

    • 对于 点号键(.),如果 紧接数字符号 后面 按 一次 是 点号(不 上屏),按 第二次 是 句号(。)。

  3. 【←、→ 键】控制 光条词库词  之间 移动(▼鼠标 指向 图片 播放 演示)
     

  4. 【ctrl + ←、ctrl + → 键】控制 光条 待定词  之间 移动(▼鼠标 指向 图片 播放 演示)

  5. 编辑 汉字:可以 用 退格键(Backspace)删除 光标 前面 一个 汉字,或者 用 删除键(Delete / Del )删除 光标 后面 一个 汉字;在 光标 位置 插入 汉字。(▼鼠标 指向 图片 播放 演示)

  6. 编辑 拼音字母:要点,先 用 上、下 方向键 切换 到 拼音字母 状态(参见 切换组合(▼鼠标 指向 图片 播放 演示)

  7. 【↑、↓ 键】切换 编码组合。 一个 待定词 的 编码组合 按照 字数 最少、词库词 数目 最少 的 顺序 排列。(▼鼠标 指向 图片 播放 演示)

  8. 数字键:在 出现 候选词列表 的 情况 下 用于 选择 候选词;在 没有 候选词列表 的 情况 下,比如 输入 空格 或 其它 非拼音编码 后,或者 拼音编码组合 切换 到 英文字母 时,用作 数字键 输入 数字符号;数字 后面 紧接着 输入 汉字,则 量词 优先 排列 在 候选词列表 的 前面。

  9. ·姓名间隔符号:小句号(`),即 主键盘区 左上角 第一个 键,即 ,在 中文输入法 状态 下 转换 为 间隔符号(·),用于 姓名 间隔符号。 比如:张·三、李·四、比尔·盖茨、王· 先生、张· 小姐、·晓燕、·丽丽……。 词句输入法 有 一个 特殊的 功能:在 常见 姓氏的 拼音编码  后面 输入 (·)间隔符号,姓氏 汉字 会 优先 排列 在 候选词列表 的 最前面,方便 输入 姓名。

  10. 【PageDown、PageUp】候选词 列表 翻页

  11. 用户词库:词句输入法 有 两个 词库,py.txt 和 userdict.txt。 这 两个 词库 都是 Unicode 编码 文本文件,很容易 看懂 和 编辑。 前者 是 输入法 自带的 基础词库,收入 字、词、成语 共计 七万七千多条;后者 就是 用户词库,用于 记录 使用 过程 中 遇到的 新词 和 调整 词频。

    • 新词标准:这里的 所谓 “新词” 是 相对而言的。 当 用户 输入了 在 基础词库 中 不存在的 待定词,或者说,新组的 词,就是 新词。

    • 调整词频 机制:用户词库 不仅仅 记录 新词,而且 记录 需要 提高 词频 的 旧词。 当 一个 原本 不是 首选 的 词 被 用户 挑选 使用了,它 就 会 被 记录 到 用户词库。

    • 用户词库 的 管理:1. 可以 用 文本编辑 工具 直接 编辑 修改。 建议 在 修改 之前 备份。 2. 也 可以 通过 针对 候选窗口 中 出现的 某个 候选词 进行 快捷 调整,方法 是 对准 该词 单击右键 然后 选用 快捷菜单 中的 命令。 注意:只有 属于 用户词库 中的 词 才能 弹出 快捷菜单。

  12. 特殊 编码 转换 规则:为了 提高 输入效率,某些 后缀 或 常用 单字、词  有  特殊的 编码转换 规则(参见 下表),但是 这个 规则 并不 改变 拼音编码 规则,只是 特定的 字、词 的 优先 顺序 有所 改变。
     

    待定词 拼音编码 首选转换结果

    说明

    ……d ……的

    默认 为 形容词 后缀 “的”,除非 d 与 前面的 编码 组成 词库词。

    ……di ……地

    默认为 副词 后缀 “地”,除非 di 与 前面的 编码 组成 词库词。

    ……m ……们

    默认为 名称词 复数 后缀 “们”,除非 m 或 men 与 前面的 编码 组成 词库词。

    ……z ……者

    默认为 名称词化 后缀 “者”,除非 z 或 zhe 与 前面的 编码 组成 词库词。

    ……zh ……着

    默认为 动词 后缀 “着”,除非 zh 与 前面的 编码 组成 词库词。

    ……l ……了

    默认为 动词 完成式 后缀 “了”,除非 l 或者 le 与 前面的 编码 组成 词库词。

    ba 把/吧

    句尾 首选 为 “吧”,否则 为 “把”。 或者说,“ba”+空格 自动 由 “吧” 变成 “把”。

  13. 云词库: 最新的 流行词,可以 试一试 按 F2 调用 云词库。 比如 “mahang”,按 F2 就会 打出 “马航”。 云词库 是 按照 光条 当前 所处的 位置 上的 待定词 取词。

版本 变动 情况 说明:

2.1版:

  1. 兼容 各种 等级 的 用户帐户控制(UAC) 设置。 之前的 2.0版 只能 在 Windows 8.x 系统 的 用户帐户控制(UAC)最低 等级 (从不通知) 下 才 能够 正常 运行。

  2. 改善了 词库 读入 方式。 在 一般 桌面应用(区别于 windows 8 之后 引入的 Windows Store App——瓷贴界面 应用程序) 中 采用 词库文件 内存映射 共享 方式,提高了 内存的 使用效率。

  3. 修正 若干 Bug。

2.0版:

  1. 支持 Windows 10操作系统。

  2. 新增 输出的 文本格式 选项。

1.1版:

  1. 修复 在 Windows XP 环境 下 Tab 键、Shift 组合键 失效 的 Bug。

  2. 新增 模糊拼音 输入 功能。

 

Copyright © 2004~2012 Cyberhorse Workshop. All Rights Reserved