全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1943 1
2020-12-05
基于最小编辑距离,计算两字符串i相似度,语言。
输入:任意两个字符串,(不限制)
打印输出:距离
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-12-12 11:21:27
首先 安装 https://pypi.org/project/textdistance/
pip install textdistance

    import textdistance
    print(textdistance.levenshtein('test', 'text'))
    # 1
    print(textdistance.levenshtein.distance('test', 'text'))
    # 1
    print(textdistance.levenshtein.similarity('test', 'text'))
    # 3
    print(textdistance.levenshtein.normalized_distance('test', 'text'))
    # 0.25
    print(textdistance.levenshtein.normalized_similarity('test', 'text'))
    # 0.75

另外这个库除了提供编辑距离之外,还有提供汉明距离等30+的字符串距离算法
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群