TF-IDF最新内容 - 专知

会员服务 ·

TF-IDF

TF-IDF（英语：term frequency–inverse document frequency）是一种用于信息检索与文本挖掘的常用加权技术。tf-idf是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。tf-idf加权的各种形式常被搜索引擎应用，作为文件与用户查询之间相关程度的度量或评级。除了tf-idf以外，互联网上的搜索引擎还会使用基于链接分析的评级方法，以确定文件在搜索结果中出现的顺序。

BERTopic：NLP主题模型的未来！

BERTopic：NLP主题模型的未来！

夕小瑶的卖萌屋

3+阅读 · 2022年7月8日

可以写进简历的10个项目，网申通过率提升50%

可以写进简历的10个项目，网申通过率提升50%

图与推荐

2+阅读 · 2021年11月4日

强烈推荐十大NLP主流经典项目：预训练BERT、知识图谱、智能问答、机器翻译、文本自动生成等

强烈推荐十大NLP主流经典项目：预训练BERT、知识图谱、智能问答、机器翻译、文本自动生成等

PaperWeekly

0+阅读 · 2021年11月1日

智能滚动：让转录后的文本编辑、共享和搜索更容易

智能滚动：让转录后的文本编辑、共享和搜索更容易

谷歌开发者

0+阅读 · 2021年1月18日

【NLP.TM】情感（观点）分析

【NLP.TM】情感（观点）分析

AINLP

1+阅读 · 2020年11月20日

文本挖掘从小白到精通（二十二）短文本主题建模的利器 - BERTopic

文本挖掘从小白到精通（二十二）短文本主题建模的利器 - BERTopic

AINLP

10+阅读 · 2020年11月8日

NLPer 如何做关键词抽取

NLPer 如何做关键词抽取

AINLP

2+阅读 · 2020年10月22日

五千字全面梳理文本匹配

五千字全面梳理文本匹配

AINLP

5+阅读 · 2020年10月3日

工业级命名体识别经验+代码总结

工业级命名体识别经验+代码总结

AINLP

3+阅读 · 2020年10月2日

如何学会看 arxiv.org 才能不错过自己研究领域的最新论文？

如何学会看 arxiv.org 才能不错过自己研究领域的最新论文？

极市平台

0+阅读 · 2020年8月19日

文本数据增强：撬动深度少样本学习模型的性能

文本数据增强：撬动深度少样本学习模型的性能

AINLP

0+阅读 · 2020年8月15日

CNN如何用于NLP任务？一文简述文本分类任务的7个模型

CNN如何用于NLP任务？一文简述文本分类任务的7个模型

深度学习自然语言处理

0+阅读 · 2020年7月26日

这款NLP神器火了！关键词一键提取、结果高度可视化，堪称「小白进阶大神」的实用工具包 | 开源

这款NLP神器火了！关键词一键提取、结果高度可视化，堪称「小白进阶大神」的实用工具包 | 开源

量子位

0+阅读 · 2020年7月6日

瑞士小哥开源文本英雄Texthero：一行代码完成数据预处理，网友：早用早下班！

瑞士小哥开源文本英雄Texthero：一行代码完成数据预处理，网友：早用早下班！

新智元

2+阅读 · 2020年7月6日

中文文本挖掘预处理流程总结

中文文本挖掘预处理流程总结

深度学习自然语言处理

2+阅读 · 2020年6月11日

参考链接

微信扫码咨询专知VIP会员