找回密码
 立即注册
CeraNetworksBGVM服务器主机交流会员请立即修改密码Sharktech防护
查看: 39|回复: 4

请教PHP计算两段文字的相似性

[复制链接]

26

主题

38

回帖

184

积分

注册会员

积分
184
发表于 2021-12-16 13:39:48 | 显示全部楼层 |阅读模式
比如第一句:
故事发生在东北乡下的一个普通村落——兴隆屯
第二句:
兴隆屯的陈满金家是一个比较典型的四世同堂的中国农民家庭
(随便copy的例子不用认真看)

提取出第一句和第二句中的所有汉字(不算数字,字母,符号),
然后,计算第一句中的汉字,有多少个出现在第二句中。

然后再反过来计算第二句中的汉字,有多少个出现在第一句中。

两次计算,有一次达到一定比例,比如50%,就算命中。


有没有现成的轮子?
回复

使用道具 举报

59

主题

285

回帖

1425

积分

金牌会员

积分
1425
发表于 2021-12-16 13:41:57 | 显示全部楼层
https://blog.csdn.net/mim2017/article/details/108596690
回复

使用道具 举报

16

主题

440

回帖

1358

积分

金牌会员

积分
1358
发表于 2021-12-16 13:42:20 | 显示全部楼层
先转换成数组,然后求交集array_intersect
回复

使用道具 举报

30

主题

1714

回帖

4364

积分

论坛元老

积分
4364
发表于 2021-12-16 14:20:27 | 显示全部楼层
重复的汉字怎么办,转一下编码放数组里面,取个交集,然后cont一下数量。
回复

使用道具 举报

241

主题

1080

回帖

4023

积分

论坛元老

积分
4023
发表于 2021-12-16 14:22:20 | 显示全部楼层
如果是java,都放入list,然后用stream,filter 就可以搞定或取出重复的汉字
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|HS2V主机综合交流论坛

GMT+8, 2024-11-18 13:27 , Processed in 0.053564 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表