nlp 任务数据清洗

Mike · October 15, 2023, 2:45am

在一个 nlp 任务中，我现在有一批数据，数据中每个元素包含多个字符串。对于数据清洗有两个问题，还希望相关方向或有相关经验的 uu 给点建议：

anonymous_coward_old · October 15, 2023, 3:48pm

第一个任务很难吗？不是直接 .removesuffix() 就完了
第二条任务可以调用 OpenAI Embeddings

Topic		Replies	Views
研究称百度弱智吧中文训练效果高于知乎豆瓣小红书谈笑风生	0	63	April 7, 2024
对分类和标签的建议网站	2	150	June 3, 2023
关于新的分类：NSFW 网站	2	280	August 24, 2023
来点 xps 高手谈笑风生	0	72	June 7, 2023
汇编语言复习参考资料学习资料	6	289	April 1, 2025
榜上大学习次数好多啊谈笑风生	4	116	December 4, 2023
求问阅读论文的工具或者资源推荐谈笑风生	8	149	May 7, 2024
若访问出错，请清理浏览器缓存，并确保使用的是.app 域名网站	2	37	December 14, 2024
purge zombies 网站	3	95	December 25, 2024
data lab 倒数第二道题计算机系统导论	1	204	March 2, 2024