This topic has been archived. It cannot be replied.
-
枫下家园 / 电脑电信 / 请教excel的应用技巧:两个文档,每个文档只有一列,多行,每行是一两句话。如何能快速识别出A文档的每一行和B文档的哪一行最相似?相似度可以用match到的word数目来衡量,去除虚词。这个得写code才能实现吧?有高手给指点吗?也可以考虑两个文档是一个文档的两列。
-ditto(ditto);
2021-4-13
{76}
(#13631928@0)
-
Ultracompare?
-troyd(Troy);
2021-4-13
(#13631941@0)
-
谢谢,试试看
-ditto(ditto);
2021-4-13
(#13631988@0)
-
两种方法:1 把两个文档的表合到一个文档内,然后用SORTING 就会比较直观地发现哪些重复较多和较少的。2. 用SDL TRADOS 翻译软件,如果把你其中的一个文档生成T句库(TM) 的话,这个软件就会解析出来另一个文档与句库文档有多大的重复度。
-liaison01(红桃A);
2021-4-14
(#13632129@0)
-
谢谢。sorting对多个词构成的句子,能直观判断吗。。。第二种方法完全不懂。是一个朋友的问题,我把您的方法转发给他。
-ditto(ditto);
2021-4-14
(#13632149@0)
-
这个是natural language分析的任务,一般用python,有Library可以用。
-youbet(🍑);
2021-4-14
(#13632148@0)
-
对,严格说确实是NLP的问题
-ditto(ditto);
2021-4-14
(#13632152@0)
-
把两个文档的例子给一些,show 一些 sample,大家才好看怎么match,但听起来不是什么难事,c#也就几行code就可以搞定
-binghongcha76(一只大猫);
2021-4-14
(#13632430@0)
+1