LOGO OA教程 ERP教程 模切知识交流 PMS教程 CRM教程 开发文档 其他文档  
 
网站管理员

C# Net 比较2个字符串的相似度(使用余弦相似度)

admin
2023年3月22日 17:51 本文热度 717

本文章向大家介绍C#.Net 比较2个字符串的相似度(使用余弦相似度),主要包括C#.Net 比较2个字符串的相似度(使用余弦相似度)使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

/// <summary>

/// 比较2个字符串的相似度(使用余弦相似度)

/// </summary>

/// <param name="str1"></param>

/// <param name="str2"></param>

/// <returns>0-1之间的数</returns>

public static double SimilarityCos(string str1, string str2)

{

    str1 = str1.Trim();

    str2 = str2.Trim();

    if (string.IsNullOrEmpty(str1) || string.IsNullOrEmpty(str2))

    return 0;

    List<string> lstr1 = SimpParticiple(str1);

    List<string> lstr2 = SimpParticiple(str2);

    //求并集

    var strunion = lstr1.union(lstr2);

    //求向量

    List<int> int1 = new List<int>();

    List<int> int2 = new List<int>();

    foreach (var item in strunion)

    {

     int1.Add(lstr1.Count(o => o == item));

     int2.Add(lstr2.Count(o => o == item));

    }

    double s = 0;

    double den1 = 0;

    double den2 = 0;

    for (int i = 0; i < int1.Count(); i++)

    {

     //求分子

     s += int1[i] * int2[i];

     //求分母(1)

     den1 += Math.Pow(int1[i], 2);

     //求分母(2)

     den2 += Math.Pow(int2[i], 2);

    }

    return s / (Math.Sqrt(den1) * Math.Sqrt(den2));

}

 

/// <summary>

/// 简单分词(需要更好的效果,需要这里优化,比如把:【今天天气很好】,分成【今天,天气,很好】,同时可以做同义词优化,【今天】=【今日】效果更好)

/// </summary>

public static List<string> SimpParticiple(string str)

{

    List<string> vs = new List<string>();

    foreach (var item in str)

    {

     vs.Add(item.ToString());

    }

    return vs;

}


该文章在 2023/3/22 17:51:57 编辑过
关键字查询
相关文章
正在查询...
点晴ERP是一款针对中小制造业的专业生产管理软件系统,系统成熟度和易用性得到了国内大量中小企业的青睐。
点晴PMS码头管理系统主要针对港口码头集装箱与散货日常运作、调度、堆场、车队、财务费用、相关报表等业务管理,结合码头的业务特点,围绕调度、堆场作业而开发的。集技术的先进性、管理的有效性于一体,是物流码头及其他港口类企业的高效ERP管理信息系统。
点晴WMS仓储管理系统提供了货物产品管理,销售管理,采购管理,仓储管理,仓库管理,保质期管理,货位管理,库位管理,生产管理,WMS管理系统,标签打印,条形码,二维码管理,批号管理软件。
点晴免费OA是一款软件和通用服务都免费,不限功能、不限时间、不限用户的免费OA协同办公管理系统。
Copyright 2010-2024 ClickSun All Rights Reserved