admin管理员组

文章数量:1437464

Datawhale AI春训营二期

1.多次测试的结果

第一次和第二次的,都是使用的baseline:

image-20250426173120786

第三次的:

image-20250426173100719

2.分数是如何提高的

之前的几次都是通过这个baseline进行运行的,然后今天是了解了一下这个baseline里面的相关的逻辑,看了一下这个提高分数的方法;

因为这个教程的作者设置的时候是把这个数据定义成为10-30之间的随机的数值,所以我觉得这个是可以提分的一个点,因此我直接把这个limt换成了4000,但是发现这个运行的速度很慢,但是我还是坚持了下来,后来发现这个直接卡住了,所以就重新测试了一下;

第二次测试的时候发现这个还是卡到了100%,因此这两次运行花费了我大量的时间,第三次的时候我决定把这个参数调小一些,也就是下面的这个50,因为这个每一天只能提交一次,所以我换了一个账号,进行提交,发现这个分数确实是从0.2多变成了0.3几,这个初步验证了我的猜想,就是这个数据对于我们最后生成的这个结果的肯定是有影响的;

我想如果换成100,1000,这个分数可能会继续增加,但是这个毕竟只是一个优化的方向,肯定是达到了一个阈值之后就无法继续增长了,因此这个大家可以去尝试一下;

image-20250426175403169

3.关于上分点拨

在这个部分,教程的作者就我们了多个方向的思考,我拿出来两个我可以勉强理解的地方聊一聊:下面的这个是坐着给予的5各维度的提分建议;

image-20250426175925893

我可以理解的就是搜索的排序优化,以及这个推荐算法:

搜索优化:搜索算法的调整和优化,这个是可以改进的,因为这个算法的优化本来就是一个比较大的话题,不同的搜素方法得到的结果也是有很大的这个差距的,所以women如何选择更加优秀的这个算法,使得推荐给用户他们更想要的;

推荐算法:基于用户的历史记录,当用户的这个意图不是很明确的时候,我们可以使用基于用户历史的这个协同过滤算法,针对性的给予这个用户相关的建议;

4.关于task2的收获

这个教程回顾了baseline的基本思路;

了解语音识别技术,对于这个老人的需求进行识别,然后就是意图识别,确定这个老人想要什么,通过修改limit大小,提升了这个分数,这个是目前自己唯一有能力实现的这个提升分数的方式了,感谢作者的教程~~

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。 原始发表:2025-04-26,如有侵权请联系 cloudcommunity@tencent 删除数据算法优化测试教程

本文标签: Datawhale AI春训营二期