页次 1
經過使用,發現一些不應繁化的場合繁化了。暫時發現有兩例。
1、“斗篷”、“北斗”的“鬥”,讀第三聲的時候,應該維持簡化。“戰鬥”等第四聲時才作正體“鬥”。
2、同樣,“只有”的“隻”應該維持簡化。第一聲作量詞時才作正體“隻”。
因為是特定場合的使用例,看來在原轉換程序上要加上判斷語句,不知能否實現。
論壇頭像 by 『聖光守縛者』菈蒂安瑟莉雅
离线
目前簡單的程序僅僅是一一對應的轉換,不同詞組中使用不同的字涉及到中文分詞技術,javascript就無能為力。同樣的例子還有簡、繁體中慣用語的區別:比如“伺服器、伺服器”,“程序、程式”,“緩存、快取”,“內存、記憶體”等等,這些高級功能用簡單的轉換程序做不到。
中文分詞是一門很有技術含量的學問,目前在簡繁轉換方面做得好的軟件只有微軟的word、金山wps等。
分詞對於中文搜索引擎來說也是一項必備技術,分詞做得好不好可以直接用來判斷一款搜索引擎的優劣。
以龍為本
<-- 目前頭像 by 理業化肥
聯繫方式:站內短消息或郵件
离线
我曾經見過用PHP+某種資料庫做的分詞引擎,據作者說效果還不錯,可以自己補充詞庫。影子去找找看,如果找到了可以嘗試修改後用在簡繁轉換上。
想要知道真相嗎?去找吧!所有的真相一直都在那裏!
离线
不知道執行效率如何,記得名字嗎?
以龍為本
<-- 目前頭像 by 理業化肥
聯繫方式:站內短消息或郵件
离线
名字想不起來了,我覺得效率可能得看伺服器夠不夠強了,而且安全性也需要自己多加完善。
想要知道真相嗎?去找吧!所有的真相一直都在那裏!
离线
我找到類似的東西了,支持詞組轉換,基本上Rei說的情況都能正確轉換,不過美中不足的是它會出這樣啼笑皆非的錯誤:
已經給作者留了言,建議他去掉這類慣用語轉換。不轉換慣用語總比出錯要好吧。
以龍為本
<-- 目前頭像 by 理業化肥
聯繫方式:站內短消息或郵件
离线
我見過“太厘米豬肉”(原句“太公分豬肉”)……
論壇頭像 by 『聖光守縛者』菈蒂安瑟莉雅
离线
我裝了兩個Firefox插件:ImTranslator 和 同文堂
簡繁轉換很方便
單機版的工具,速度也不錯。覺得網頁轉換效果不好的可以試試
以龍為本
<-- 目前頭像 by 理業化肥
聯繫方式:站內短消息或郵件
离线
页次 1