人工智能顶级Kaggle竞赛 长翼小班课带你冲

在美国,申请名校的顶级专业:计算机和人工智能,是非常有挑战性的。计算机第一名校:卡耐基梅隆大学的 CS 系录取率仅有 7%。在所有的理工科竞赛中,Kaggle竞赛因其超高级别(全球级),超高含金量,面向未来最有爆发力的科技方向,和稀缺的赛道资源,受到各名校面试官的高度重视,成为名校申请的利器。

Kaggle是谷歌主持的全球顶级的权威性 AI 竞赛平台,是人工智能行业绝对的 No.1 比赛。在人工智能大行其道的今天,能在人工智能方向出成绩的孩子却非常稀缺,文书上出现 Kaggle 竞赛成绩,绝对会让名校面试官眼睛一亮,果断下定。可惜的是,目前很多招生顾问和教育机构缺乏了解,甚至对 Kaggle 竞赛一无所知。

长翼教育的 Kaggle 人工智能竞赛班为立志名校的孩子提供优秀的 Kaggle 竞赛辅导课程。

Kaggle 竞赛介绍

AI Kaggle 是一个著名的在线数据科学和机器学习竞赛平台。它提供了大量的数据集和挑战,供参赛者解决社会实际问题。Kaggle 旨在促进数据科学社区之间的合作和学习。

参赛者可以通过 Kaggle 探索、分析和解决各种问题,如科技、医疗、教育等。Kaggle 提供了强大的云计算环境和丰富的工具,供参赛者训练模型、提交预测结果并与其他选手竞争。参赛者可以通过参与 Kaggle 竞赛来提升他们的数据科学和机器学习技能,还有机会获得奖金和就业机会。

此外,参与Kaggle竞赛还可以展示申请者的解决问题和团队合作的能力,这些都是大学所看重的品质。

竞赛队伍需写代码分析大数据集建立 AI 模型,再利用测试数据集评测该模型的优异。每支队伍都可以自由参加竞赛,并不断完善提交的方案,直到最后决出优胜者。

长翼 Kaggle 竞赛课程

长翼教育是全美极少数的能开设 Kaggle 竞赛课的教育机构;有成熟的课程体系,和多年的 Kaggle 竞赛实战经验。长翼教育开设 Kaggle 人工智能基础班和 Kaggle 竞赛实战班。长翼教育的赵老师率领的 Kaggle 竞赛队一路披荆斩棘,已多次获得优异成绩。

本期, 长翼教育 Kaggle 竞赛课程有:

  1. 7-10 年级 Kaggle 人工智能竞赛初级班,每周日 4:00pm-6:00pm
  2. 7-10 年级 Kaggle 人工智能竞赛实战班,每周末 根据具体比赛项目而定

(所需课程:python 2年左右和Kaggle基础班)

报名课程,或了解更多长翼教育的顶级老师和课程,请联系:

微信:Longwings-edu 

电话:929-456-9647

线下地址:175 Great Neck Road Suite 307



长翼教育位于纽约顶级学区大颈,提供小初高补习, 兴趣, 竞赛, AP, SAT和升学指导等服务。5次闯入机器人世界赛,2019 囊括纽约最大辩论赛前三名,计算机奥赛得奖,2022北京冬奥会邀请赛季军

长翼教育视课程质量为生命。授课精选公私校明星教师,包括AP和SAT考试出题老师和判卷老师。

长翼系列网课被西雅图,加州,新泽西等地大型教育机构直接植入;私教课更因提分迅速,被很多孩子认为是最有价值的网课。

2023年,长翼将开启企业微信,为家长们提供更优质的教育服务。


工业界权威AI竞赛Kaggle银奖,2期团队招生中;长翼2023春季小班课招生

【长翼教育】推出工业界最权威AI竞赛-Kaggle人工智能和大数据竞赛培训课程。

课程教师团队都是从事AI相关方向的博士生或博士后,成员有在字节跳动苹果研究的经历,研究方向包括机器学习,深度学习,强化学习和人机交互。

主讲老师6次在计算机机器学习和人机交互顶会 (CHI, UIST) 发表学术论文并2次获得最佳论文荣誉提名奖。团队有多年AI教学经验,尤其擅长人工智能,Python和Kaggle竞赛项目课程。多次参加kaggle机器学习竞赛并获得银牌和铜牌

LWE-2023 Kaggle1期团队成绩-
OTTO银牌
,排名80/2587 (top 4%)

LWE 2023 Kaggle竞赛2期团队招生中–

5月赛题:“使用蛋白质和肽数据来预测帕金森病患者的疾病进展”
(团队以银奖为目标;3月开课,5月见成绩)

报名截止: 3月08号
费用:$3,600/per person
学习经验: python 1年以上
经老师审核后可入队(5人上限)



Kaggle竞赛介绍

Kaggle是一个面向数据科学家和机器学习爱好者的在线社区平台。Kaggle允许用户与其他用户协作,查找并发布数据集,使用集成了GPU的Python在线编译平台,并与其他数据科学家竞争,以解决数据科学挑战。这个在线平台 (由Anthony Goldbloom和 Jeremy Howard于2010年创建,并于2017年被谷歌收购) 的目标是通过其提供的强大工具和资源,帮助专业人士和学习者在数据科学之旅中实现他们的目标。截至2021年,Kaggle的注册用户超过800万。

使Kaggle成为如此受欢迎的资源的子平台之一是他们的竞争。就像HackerRank对软件开发人员和计算机工程师所扮演的角色一样,“Kaggle大赛”对数据科学家也具有重要意义;你可以在Kaggle竞赛指南中了解更多关于它们的知识,并在我们的Kaggle竞赛教程中学习如何逐步分析数据集。在Kaggle或DataCamp这样的数据科学竞赛中,公司和组织会分享大量具有挑战性的数据科学任务,并提供丰厚的奖励,数据科学家 (从初学者到有经验的人) 将在完成任务时进行竞争。Kaggle还提供了Kaggle Notebook,就像 DataCamp Workspace一样,它允许你在浏览器上编辑和运行数据科学任务的代码,所以你的本地计算机不必做所有繁重的工作,你也不需要自己设置一个新的开发环境。

Kaggle在云上提供强大的资源,允许您每周最多使用30小时的GPU和20小时的TPU。你可以上传你的数据集到Kaggle,也可以下载别人的数据集。此外,你可以查看其他人的数据集和代码,并在上面开始讨论话题。你所有的活动都会在这个平台上被评分,当你帮助别人和分享有用的信息时,你的分数会增加。一旦你开始获得积分,你就会出现在800万Kaggle用户的实时排行榜上。

Kaggle适合不同群体的人,从对数据科学和人工智能感兴趣的学生到世界上最有经验的数据科学家。如果你是一个初学者,你可以利用Kaggle提供的课程。通过加入这个平台,您将能够在一个由不同专业水平的人组成的社区中取得进步,并且您将有机会与许多经验丰富的数据科学家进行交流。当你获得Kaggle积分和奖章,这是你进步的证明,你甚至很有可以用你的奖牌成绩去申请美国一流常春藤大学 (哈佛, 麻省理工, 斯坦福等) 或者吸引大公司 (苹果, 谷歌, 微软, 亚马逊等) 的猎头和招聘人员,并开启新的工作机会。

最后,无论在申请美国一流大学还是在申请数据科学方面的工作时,提及你的Kaggle经历肯定会产生积极的影响。不用说,所有这些好处也适用于经验丰富的数据科学家。无论你的经验有多丰富,这个平台都提供了持续学习和提高的可能性,当然,伴随比赛而来的奖励也同样有趣。



竞赛项目:快,画!涂鸦识别挑战

《Quick, Draw!》作为一款实验性游戏发行,旨在以一种有趣的方式教育公众人工智能是如何工作的。游戏会提示用户画一幅描述特定类别的图像,如“香蕉”、“桌子”等。游戏生成了超过10亿张图纸,其中的一个子集被公开发布,作为本次比赛训练集的基础。这个子集包含50万张图纸,包含340个标签类别。

听起来很有趣,对吧?挑战在于:由于训练数据来自游戏本身,所以绘图可能是不完整的,或者可能与标签不符。您需要构建一个识别器,它可以有效地从这些数据中学习,并在来自不同发行版的手动标记测试集上良好地执行。

您的任务是为现有的Quick, Draw!数据集。通过在这个数据集上改进模型,Kagglers可以更广泛地改进模式识别解决方案。这将对手写识别及其在OCR (光学字符识别)、ASR (自动语音识别) 和NLP (自然语言处理) 等领域的稳健应用产生直接影响。

竞赛项目:人体蛋白图谱图像分类比赛奖励

在这场比赛中,Kagglers将开发出能够对显微镜图像中的蛋白质混合模式进行分类的模型。人类蛋白质图谱将使用这些模型建立一个与他们的智能显微镜系统集成的工具,从高通量图像中识别蛋白质的位置。

蛋白质是人类细胞中的“实干家”,执行着许多使生命得以存在的功能。历史上,蛋白质的分类一直局限于一种或几种细胞类型的单一模式,但为了充分了解人类细胞的复杂性,模型必须对一系列不同的人类细胞的混合模式进行分类。

将细胞中的蛋白质可视化的图像通常用于生物医学研究,这些细胞可能是医学下一个突破的关键。然而,由于高通量显微镜技术的进步,这些图像的生成速度远远快于人工评估。因此,自动化生物医学图像分析的需求比以往任何时候都要大,以加速对人类细胞和疾病的了解。

《Nature Methods》杂志表示有兴趣考虑一篇讨论这一挑战的结果和方法的论文。人类蛋白质图谱团队希望邀请表现最好的团队加入,作为本文的共同作者。

表现最好的队伍也将有资格角逐特别奖。在主竞赛结束后,有关特别奖和《Nature Methods》合著者的其他信息将通过讨论帖子提供。

竞赛项目:癌症病理检测背景介绍

在这场比赛中,你必须创建一种算法,从更大的数字病理扫描中提取小图像块,识别转移性癌症。本次竞赛的数据是PatchCamelyon (PCam) 基准数据集的轻微修改版本 (原始的PCam数据集由于其概率抽样而包含重复的图像,但是在Kaggle上呈现的版本不包含重复的图像)。

PCam非常有趣,因为它的规模、易于上手和可接近性。用作者的话来说:

[PCam] 将临床相关的转移检测任务打包为直接的二值图像分类任务,类似于CIFAR-10和MNIST (数字识别)。模型可以很容易地在一个图形处理器上训练几个小时,并在Camelyon16任务的肿瘤检测和全幻灯片图像诊断中获得有竞争力的分数。此外,任务难度和可驾驭性之间的平衡使它成为主动学习、模型不确定性和可解释性等主题的基础机器学习研究的主要对象。