暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Coggle 2023:年度总结与展望

Coggle数据科学 2024-02-19
247

2023年很快就过去,但我(仅代表阿水、鱼佬和几位小助手)还意犹未尽。本文将从非技术的角度回顾竞赛和个人在这一年的感受。

如果想要抽奖,请直接翻到末尾😄

unsetunset竞赛这一年unsetunset

2023年是数据竞赛领域的一年,令人瞩目。从年初到年末,大模型的发展如雨后春笋般迅速,改变了竞赛格局。

比赛发展与变化

从2023年年初到现在,国内国外大模型的发展蓬勃发展,尤其在自然语言处理(NLP)领域,大模型的应用带来了翻天覆地的变化,挑战着传统的竞赛范式。

在计算机视觉(CV)领域,大模型的应用也日益普及。诸如CLIP等模型的出现,开辟了更多的应用场景,为CV竞赛带来了全新的挑战和机遇。

而对于数据挖掘比赛,现在常用的轻量级梯度提升算法,如LightGBM、XGBoost、CatBoost等,都已经支持GPU加速训练。这意味着数据挖掘比赛不再局限于算法的选择,而是开始竞速硬件性能。

大模型改变了NLP比赛

以比赛CommonLit - Evaluate Student Summaries为例,大模型在NLP中有很多用途。

  1. 关联未标记数据与标记数据:通过元伪标签技术,将未标记的数据与标记的数据关联起来,从而扩充了训练数据集,提高了模型的泛化能力和性能。
  2. 引导模型生成:精心设计的提示语引导大模型生成与主题相关的文本,帮助模型更好地理解不同的主题,提高了模型在多样性主题上的表现。
  3. 提高数据多样性:通过增加主题的多样性,扩展了训练数据集,使模型能够更好地应对各种不同的主题和情境,从而提高了模型的泛化能力和适应性。

unsetunset个人职业发展unsetunset

2023年是大模型如雨后春笋般涌现的一年,但我发现自己对于新技术的期待与困惑交织在一起。

失眠与徘徊

在23年上半年我感到非常迷茫,不知道未来应该学习什么才能跟上行业的步伐。我也不知道未来的发展是不是就被马上替代,我思考和恐慌。但学习大模型的过程很慢,导致更加焦虑。

对于像ChatGPT这样的技术,我抱有很高的期待。然而,现实却是大多数时候它们呈现出一种黑盒的状态。尽管有大量的论文和技术文档,但其中的细节却很难理解。这让我感到挫败,因为我渴望通过实践来理解和掌握新技术,而这种黑盒状态却成为了一道阻碍。

我渴望能够动手实践,但是使用大模型需要庞大的计算资源和数据支持。我常常陷入思考,作为一个个体,如何才能真正地将知识转化为行动,而不是停留在理论和期待之中。

对自己进行定位

在通过长时间的思考过后,我发现尽管大模型如ChatGPT等技术的涌现让人眼花缭乱,但我意识到我更倾向于实用主义的思考方式。

在23年下半年,我不断反思和思考:我自己必须是一个能独立开发GPT的人吗?其实没有必要。其实对于绝大部分同学理解如何将这些技术应用到实际问题中,解决现实挑战,比纠缠于其底层原理更为重要。

并不是所有人都需要深入研究它们的底层工作原理。对我(以及绝大部分的同学)而言,更重要的是能够将其应用到解决现实世界中的问题,并从中获得实际的成就感和价值。

unsetunset我们的创作unsetunset

偏执的「我们」

作为一个公众号作者,我常常反思自己的文章,思考它们是否具有足够的价值和吸引力。我经常不断地问自己:如果我是读者,我会对我的文章感兴趣吗?我写的文字是否能够为读者提供价值?我的文章是否值得一读?


想写的不想写的
读者想看的实用技巧、案例分析、行业趋势分析新奇趣闻、独家内幕、轶事趣闻
读者不想看的技术文档翻译、理论探讨、过于专业化内容专业领域知识、深度研究报告、专业技术教程

我希望通过我的文字,能够启发读者思考,提供新的观点和见解。我相信,只有不断地追求自我提升和创新,我才能够真正地与读者建立起信任和共鸣。

商业推广

在我们的日常文章中,你可能会注意到一些商业广告的存在。我想强调的是,这些广告并不是我个人的首选,而是出于确保公众号持续运营的需要。

作为一个内容创作者,我致力于提供有价值的内容,同时确保公众号的运营和发展。然而,为了保持公众号的持续更新和改进,我们需要依赖一些商业合作和广告支持。

我们希望你能理解这一点,并且能理解我们。有时候,这些广告可能会提供一些有趣或有用的信息,或者与你的兴趣和需求相关。点击广告不仅有助于支持公众号的运营,也可能会为你带来意想不到的收获。

unsetunset未来展望unsetunset

我们计划创建一个在线论坛,为大家提供一个交流讨论的平台。这个论坛将成为一个聚集数据竞赛爱好者和数据科学实践者的社区,我们将在这里分享经验、讨论技术、解决问题,共同成长。

通过这个论坛,我们希望能够促进国内竞赛和数据科学领域的发展。我们将为大家提供一个开放、包容的环境,让更多的人参与到竞赛和数据科学的学习和实践中来。

unsetunset抽奖活动unsetunset

欢迎大家持续对我们的支持,也欢迎所有的粉丝参与下面的抽奖活动。最后祝愿大家新年快乐,万事如意。

学习大模型、推荐系统、算法竞赛
添加👇微信拉你进群
加入了之前的社群不需要重复添加~


文章转载自Coggle数据科学,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论