最新发布

# 2023-02-09
华为三款新机上市：预装HarmonyOS系统，但不支持5G，3699元起
大家都知道现在的手机市场主要还以5G手机为主，但深受芯片限制的华为也不得不再把4G手机拿出来“炒冷饭”。今日零点，华为多款4G新机正式开售，分别是华为Mate40 Pro 4G、Mate40E 4G以及nova8 Pro 4G。在5G
# 2023-02-09
鸿蒙系统网页捷径怎么关闭
在华为浏览器设置中进行关闭。具体步骤：1.打开华为浏览器点击右下角更多。2.打开按键设置，选择主页设置。3.选择自定义主页，接下来选择自定义网址，就可以让捷径这个功能消失了。首先，您需要了解升级Harmony OS前的准备工作：1.升级前，
# 2023-02-09
华为首款三分频智能音箱，HarmonyOS家族的颜值与音质担当
HUAWEI Sound X系列从2019年正式推出之后，便备受用户好评。第一代HUAWEI Sound X与帝瓦雷联合设计，在智能音箱当时大多处于功能性的大环境下，第一代HUAWEI Sound X让用户体验到了智慧与音质并
# 2023-02-09
4月27日华为正式推送鸿蒙系统升级。鸿蒙OS系统你真的了解吗？
4月27日晚，华为向部分机型推送了鸿蒙0S系统小规模公测升级，据可靠消息称，华为将在6月推送大规模正式公测升级。很多人收到了华为Harmony OS的推送，根据各个机型的不同，更新包大小也不相同，有的是2.87 GB，有
# 2023-02-09
harmonyos2.0.0系统好用吗
harmonyos2.0.0系统好用。对于HarmonyOS 2.0系统，最大的感受就是流畅。此前有很多用户担心从EMUI系统过渡到鸿蒙系统会不适应，其实HarmonyOS 2.0系统真的会让用户用了以后爱不释手。不管是服务卡片还是动画过
# 2023-02-09
荣耀手机也能升级鸿蒙系统，可升级的机型名单已公布
昨天晚上，华为正式发布了HarmonyOS 2手机操作系统，一大批华为手机终端产品均可升级，对于荣耀用户来说，也十分关心自己的机型是否可以升级鸿蒙系统。昨天晚上，荣耀官方也同步公布了HarmonyOS 2可升级机型清单。根据荣耀官方的消
# 2023-02-09
p50HarmonyOS新桌面有哪些功能？
HarmonyOS 提供服务卡片、大文件夹和小艺建议，让您把重要信息放在眼前，操作更快捷，屏幕也更个性化。P50手机系统为HarmonyOS 2，具体功能如下：状态栏：通过顶部状态栏查看手机状态、通知消息。大文件夹：无需展开文件夹，可一步打
# 2023-02-09
p50HarmonyOS新桌面有哪些功能？
HarmonyOS 提供服务卡片、大文件夹和小艺建议，让您把重要信息放在眼前，操作更快捷，屏幕也更个性化。P50手机系统为HarmonyOS 2，具体功能如下：状态栏：通过顶部状态栏查看手机状态、通知消息。大文件夹：无需展开文件夹，可一步打
# 2023-02-09
magicos和鸿蒙os区别
magicos和鸿蒙os区别：两者定位不同，技术架构不同。两者定位不同：HarmonyOS旨在替换安卓、最终实现跨平台多设备分布式操作。MagicOS则是在安卓系统、Windows系统以及其它操作系统上叠加荣耀的核心能力，从而让不同生态实
# 2023-02-09
harmonyos是什么系统
华为harmonyos是鸿蒙系统。鸿蒙系统一款全新的面向全场景的分布式操作系统，创造一个超级虚拟终端互联的世界，将人、设备、场景有机地联系在一起，将消费者在全场景生活中接触的多种智能终端实现极速发现、极速连接、硬件互助、资源共享，用合适的设

如何计算多个文本的相似度java程序，利用向量

2023-02-27 20:19:01Python015

如何计算多个文本的相似度java程序，利用向量,第1张

String text1 = "我爱学习"

String text2 = "我爱读书"

String text3 = "他是黑客"

TextSimilarity textSimilarity = new CosineTextSimilarity()

double score1pk1 = textSimilarity.similarScore(text1, text1)

double score1pk2 = textSimilarity.similarScore(text1, text2)

double score1pk3 = textSimilarity.similarScore(text1, text3)

double score2pk2 = textSimilarity.similarScore(text2, text2)

double score2pk3 = textSimilarity.similarScore(text2, text3)

double score3pk3 = textSimilarity.similarScore(text3, text3)

System.out.println(text1+" 和 "+text1+" 的相似度分值："+score1pk1)

System.out.println(text1+" 和 "+text2+" 的相似度分值："+score1pk2)

System.out.println(text1+" 和 "+text3+" 的相似度分值："+score1pk3)

System.out.println(text2+" 和 "+text2+" 的相似度分值："+score2pk2)

System.out.println(text2+" 和 "+text3+" 的相似度分值："+score2pk3)

System.out.println(text3+" 和 "+text3+" 的相似度分值："+score3pk3)

运行结果如下：

我爱学习和我爱学习的相似度分值：1.0

我爱学习和我爱读书的相似度分值：0.4

我爱学习和他是黑客的相似度分值：0.0

我爱读书和我爱读书的相似度分值：1.0

我爱读书和他是黑客的相似度分值：0.0

他是黑客和他是黑客的相似度分值：1.0

方式二：简单共有词，通过计算两篇文档有多少个相同的词来评估他们的相似度

实现类：org.apdplat.word.analysis.SimpleTextSimilarity

用法如下：

String text1 = "我爱学习"

String text2 = "我爱读书"

String text3 = "他是黑客"

TextSimilarity textSimilarity = new SimpleTextSimilarity()

double score1pk1 = textSimilarity.similarScore(text1, text1)

double score1pk2 = textSimilarity.similarScore(text1, text2)

double score1pk3 = textSimilarity.similarScore(text1, text3)

double score2pk2 = textSimilarity.similarScore(text2, text2)

double score2pk3 = textSimilarity.similarScore(text2, text3)

double score3pk3 = textSimilarity.similarScore(text3, text3)

System.out.println(text1+" 和 "+text1+" 的相似度分值："+score1pk1)

System.out.println(text1+" 和 "+text2+" 的相似度分值："+score1pk2)

System.out.println(text1+" 和 "+text3+" 的相似度分值："+score1pk3)

System.out.println(text2+" 和 "+text2+" 的相似度分值："+score2pk2)

System.out.println(text2+" 和 "+text3+" 的相似度分值："+score2pk3)

System.out.println(text3+" 和 "+text3+" 的相似度分值："+score3pk3)

运行结果如下：

我爱学习和我爱学习的相似度分值：1.0

我爱学习和我爱读书的相似度分值：0.5

我爱学习和他是黑客的相似度分值：0.0

我爱读书和我爱读书的相似度分值：1.0

我爱读书和他是黑客的相似度分值：0.0

他是黑客和他是黑客的相似度分值：1.0

学到IO流可以比较文本了，不过用IO比较文本比较麻烦，而且效率低

如果要效率高的话，就需要学

linux + thread + progress

这样子可以通过java调用linux命令

linux中有一个comm -12命令来实现比较两个文件的共同数据，生成一个新文本。拿到新文本的大小/旧文本的大小，旧可以粗略计算出相似度，而且效率极其高

如果文本有上百万行数据的话，用IO可能要十几个小时才有结果，但是linux命令只需要1分钟左右就可以出结果

这是java的弱项，属于纯算法范畴，应该没有什么办法。

希望回答能给你带来帮助~

如果满意，请采纳，如还有疑问，可继续追问！

您也可以向我们团队发出请求，会有更专业的人来为您解答！

我爱分值相似他是黑客

# 上一篇：CSS3帧动画

# 下一篇：2020-01-07 常见分布及概率函数