Navigate to WaytoAGI Wiki →
Home/All Questions
最近有什么AI比赛
以下是为您整理的近期 AI 比赛: 1. 【灵璧 AI】安徽文创 截止日期:0115 0315 奖金奖项:一等奖 2k1、二等奖 1k2、三等奖 8005 主题+作品类型:赛道一为数字艺术创作,利用 AIGC 技术创作数字绘画、数字雕塑等艺术作品;赛道二为互动体验设计,设计互动体验项目,如 AR/VR 体验、互动游戏等;赛道三为数字故事讲述,创作以虞姬及灵璧特色历史文化为主题的数字故事,如动画短片等。 关键要求:只能提交一份作品。以压缩包上传,材料包含创作作品的源文件、prompt 指令、制作过程的关键过程截图、录屏与说明等。 提交方式:邮箱 链接: 2. 创无界智未来·文旅应用赛 截止日期:0101 0330 奖金奖项:一等奖 10w1、二等奖 6w2、三等奖 3w3 主题+作品类型:四个赛道 关键要求:模糊 提交方式:官网 链接: 3. 【凌家滩】AI 创作大赛 截止日期:0101 0415 奖金奖项:一等奖 2w1、二等奖 8k2、三等奖 2k3、优秀奖 010 主题+作品类型:“文化遗产的数字化重现与未来表达”AI 图像/AIMV/AI 视频 关键要求:无 提交方式:无 链接: 4. 【云山杯】AIGC 大赛 截止日期:0116 0225 奖金奖项:四赛道分别为一等奖 2k1、二等奖 1k1、三等奖 3003、优秀奖 10020 主题+作品类型:图片、视频、文本、音频 关键要求:【AI 图片】1.设计一个代表“杯云山”的全新品牌标志,融合传统与现代元素。2.创作一套完整的品牌视觉形象,包括颜色、字体和图案设计。【AI 视频】1.制作一个简短视频,介绍“杯云山”品牌的历史、价值观和产品特色。2.制作一段云南茶文化的纪录片,展示其历史、传统和现代发展的融合。【AI 文本】1.撰写关于“杯云山”品牌从创立到发展的故事,突出品牌的传承与创新。2.编写一个以茶园为背景的微型剧本,展示茶叶从种植到品鉴的全过程。【AI 音乐】1.创作能够代表“杯云山”的纯音乐,体现茶园的宁静与创新的活力。2.将传统云南音乐元素与现代电子音乐相结合,创作段具有地域特色和创新感的音乐作品。 提交方式:无 链接: 5. 智绘未来【台州】AI 大赛 截止日期:0122 0309 奖金奖项:①一等奖 5k1、二等奖 2k3、三等奖 1k5、台州奖 1k1;②一等奖 5.5k1、二等奖 2.5k2、三等奖 1.5k3、台州奖 1k1 主题+作品类型:AI 绘画赛道、AI 视频赛道(60S 以上) 关键要求:分辨率 2K 以上,【加分项】展现台州自然风光、人文历史、城市印象等元素,对台州未来景象的想象,或对台数字馆的未来想象相关的台州元素(额外在总分值增加 10%的分数) 提交方式:AITOP100 平台,投稿后必须转发至小红书分享并带上话题智绘未来+关注官方账号@台州数字馆。 链接:
2025-03-27
大模型训练师
以下是关于大模型训练师的相关信息: 招聘信息: 中国移动设计院正在招聘大模型开发工程师,办公地点在北京海淀中关村。 数量:1 名 学历:本科及以上 资历:5 年及以上 岗位要求: 参与大模型技术研究、大模型微调、大模型智能体研发、基于大模型的应用研发等工作。 大模型相关的数据工程,包括预训练数据、微调数据、行业数据挖掘等。 大模型相关的落地实现:如推理优化、部署、AIAgent、工具学习、领域大模型等。 技能要求: 了解大模型基本原理,包括不限于模型架构、模型预训练及微调、模型部署及推理。 熟悉 LLM 相关技术,如 transformer,prompt tuning,RLHF,langchain,Agent,MOE,RAG 等。 熟悉算法和数据结构,熟悉常用的编程语言,有较好的 Python 开发经验,编程基础扎实。 了解或掌握机器学习、深度学习基本算法原理,熟悉 AI 建模流程,在 NLP 领域有开发经验优先。 了解熟悉大模型常用训练框架、推理架构;了解分布式计算、并行计算。 联络方式:飞书与@史鹏飞联系 大模型入门指南: 通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。可以用『上学参加工作』这件事来类比大模型的训练、使用过程: 1. 找学校:训练 LLM 需要大量的计算,因此 GPU 更合适,只有购买得起大量 GPU 的贵族学校才有资本训练自己的大模型。 2. 确定教材:大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解 Token 之间的关系。 4. 就业指导:学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token 是原始文本数据与 LLM 可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表。 2024 年人工智能现状: More Money,More Problems: 预计明年会有团队花费超过 10 亿美元训练单个大规模模型。GenAI 的热潮不会消退,只是会变得更加昂贵。 Compute Squeeze: 政府和大型科技公司都将继续感受到计算需求的压力,其增长速度超过了电网的支持能力。这就像一个健美运动员增长得太快,健身房都快承受不住了——在某个时候,天花板可能会坍塌。 AI Enters Elections: 预期的 AI 对选举和就业的影响尚未显现,但这并不意味着我们可以放松警惕。记住,AI 的影响就像闪光粉:一旦出现,多年来你会在各处发现它。 人工智能仍然是令人兴奋的突破、未解决的伦理问题和无数万亿美元赌注的混合体。随着 OpenAI 在某些领域领先,Meta 在其他领域崛起,以及中国实验室不受制裁影响而上升,2024 年的 AI 舞台感觉更像是一个拥挤的拳击台,而不是一个和平的会议室。所以准备好爆米花,准备好 GPU——我们将迎来又一年的 AI 突破边界、测试极限,并可能改写一些定义。
2025-03-27
tars
Tars 相关信息如下: Tars 是一个 Obsidian 插件,基于标签建议进行文本生成,支持 Claude、OpenAI、Kimi、豆包、阿里千问、智谱、深度求索、百度千帆等。项目地址:https://github.com/TarsLab/obsidiantars 。其安装配置包括启用插件和配置插件。 UITARS 是字节的原生 GUI 智能体模型,模仿人类使用电脑或手机的方式,通过截图识别界面元素并执行操作。集成四大核心能力:感知(界面识别)、行动(操作指令)、推理(多步任务规划)、记忆(操作记录)。实现端到端学习,具备“直觉式”反应(System1)和深度思考能力(System2)。开源项目地址: 。 有开发者使用树莓派创建了一个完全功能的 TARS 复制品,最新版本甚至配备了双机械臂,可以与周围环境互动。Charles Diaz 详细公布了其制作教程、CAD 图纸和零件、代码: 。
2025-03-27
基于深度学习的商代食器分类研究 明确详细的研究意义
基于深度学习的商代食器分类研究具有多方面的重要意义。首先,它有助于深入了解商代的饮食文化和社会生活。通过对食器的准确分类,可以揭示当时人们的饮食习惯、烹饪方式以及社交礼仪等方面的信息。 其次,为考古学研究提供新的方法和视角。利用深度学习技术能够更高效、更准确地处理和分析大量的商代食器数据,突破传统研究方法的局限。 再者,有助于文物保护和管理。精确的分类有助于制定更有针对性的保护策略,确保这些珍贵的文化遗产得到妥善保存。 最后,促进跨学科研究的发展。将深度学习与考古学相结合,能够吸引更多不同领域的学者参与,推动相关研究的创新和进步。
2025-03-27
ai换脸的网站
以下为一些实现 AI 换脸的网站和方法: 1. 开源、免费的解决方案 facefusion: 开源地址:https://github.com/facefusion/facefusion 本机解决方案:需要 Python 环境,安装视频解码器等多个依赖软件,对编程知识有一定要求,且运行推理计算速度依赖 GPU,本地计算机若无 GPU 或 GPU 显存较小,执行速度缓慢,不推荐本地化安装。 云服务解决方案:可利用云厂商提供的大模型运行环境和计算能力,如阿里云的 PAI 和 AutoDL。选择 AutoDL 时,注册完成后在算力市场中选择能接受价格的算力服务器,建议选取 GPU 配置更高的算力设备。通过模型镜像启动 GPU 服务器,在算法社区查找 facefusion 镜像。 2. 利用谷歌浏览器: 打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 就进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面。 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成。 在使用相关服务和操作时,请注意遵循法律法规和平台规定。
2025-03-27
ai 数字人制作的网站
以下是一些制作数字人的网站和工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色。使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。优点是人物灵活、五官自然、视频生成快,缺点是中文人声选择较少。使用方法为点击网址注册后,进入数字人制作,选择 Photo Avatar 上传照片,然后进行后续操作。 2. Synthesia:这是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。优点是制作简单、人物灵活,缺点是免费版下载后有水印。使用方法为点击网址,点击右上角的 Create vedio,然后选择人物形象等进行后续操作。 4. KreadoAI:优点是免费、功能齐全,缺点是音色较 AI。使用方法为点击网址注册,选择“照片数字人口播”功能,然后进行后续操作。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 同时,卡尔的 AI 沃茨做的数字人课程也值得推荐,一共 15 节视频课,持续更新还会不定时增加最新的数字人内容,附赠课外社群辅导,专门解决数字人相关的问题。报名方式为扫码查看课程详细内容和介绍。 请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2025-03-27
数字人制作ai
以下是用 10 分钟轻松制作 AI 换脸、AI 数字人视频的方法: 1. 生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,然后点击右下角“添加数字人”,软件会生成对应音视频并添加到当前视频轨道中,左下角会提示渲染完成时间,之后可点击预览查看效果。 2. 增加背景图片: 删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并“导入”,选择本地图片上传,将图片添加到视频轨道上(会覆盖数字人),点击轨道最右侧竖线向右拖拽,使其与视频对齐。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 导出视频: 数字人视频完成后,点击右上角“导出”按钮导出视频以作备用。 5. AI 换脸: 执行完成后,在输出位置会出现处理后的视频,输出窗口右上角有下载按钮,可导出变量后的视频到本地。 本次制作的成本和时间: 总成本: 时间:大约 10 分钟左右。 制作数字人视频:免费。 数字人换脸:约 0.8 元。 数字人换脸时长:经实际测试 1 分 28 秒的视频,总转换时间在 200 秒。GPU 服务器此次整体运行时长所需花费 0.97 元,facefusion 软件运行只占服务器运行时长的一部分,所以换脸的成本约 0.8 元。
2025-03-27
AIPO 在哪里学习
以下是关于 AIPO 学习的相关信息: 10 月 8 日 20:00,活动说明,讲师 AJ,课程为通往 AGI 之路知识库使用指南,。 10 月 9 日 20:00,理论基础,讲师银海,课程为基础通识课,。 10 月 10 日 20:00,建站,讲师大雨,课程为 0 基础建站,,上课需提前准备注册 Github 帐号:https://github.com/ 、注册 Zeabur 帐号:https://zeabur.com/ 、注册阿里云无影帐号:https://waytoagi.feishu.cn/wiki/QrQxw1ZZbi9XMSkTafscayvsnGe 。 10 月 11 日 20:00,建站,讲师大雨,课程为 0 基础建站,,上课需提前准备注册青椒云:http://account.qingjiaocloud.com/signin?inviteCode=2GSJQYVF 。 10 月 12 日 20:00,硬件机器人,讲师 Garman,课程为从 0 手搓机器人,,上课需提前准备购买材料包。 您可以通过以下链接获取更多详细资料和作业: 10 月 10 日:。 10 月 11 日:、https://waytoagi.feishu.cn/share/base/form/shrcnET3RsU9wEzWHoFFgWWtqIb 。 10 月 12 日:、https://waytoagi.feishu.cn/share/base/form/shrcnUB08JIWtT1EK3v5rWLpCfb 。
2025-03-27
2025年3月27日AI新闻
以下是 2025 年 3 月 27 日的部分 AI 新闻: 《详解 MCP:Agentic AI 中间层最优解,AI 应用的标准化革命》:Anthropic 推出的开放协议 MCP 迅速垄断了 Agentic AI 的中间层,类似于 AI 应用的 USBC 端口。它简化了开发者与数据源的整合,促进了生态形成,可能成为“Agentic AI 领域的 Stripe”,为未来 AI 应用的标准化革命奠定基础。 《对谈|如何用 AI 增强人类学习》:Howie.Serious 与 Indigo 探讨了费曼学习法与 AI 创作的结合,强调输出能迫使知识内化。两位终身学习者分享了如何通过高效利用 AI 提升写作与学习,推动思维深度,指出未来的 AI Agent 应具备更强的自动化整合能力,助力人类保持独特价值与创造力。 《硅谷知名风投 BVP 专栏:消费级 AI 的临界点将至!》:消费级 AI 正迎来临界点,推动一波又一波的变革。随着基础模型成本降低和多模态技术进步,新的消费类 AI 公司不断涌现。未来,AI 将重塑旅行、购物和社交体验,提升个性化服务的准确性与便利性。 此外,2 月 27 日的相关新闻有:小红书 AI 赛道从 0 到 1 做 IP 的相关活动预告、工具分享及日更群计划。3 月 5 日的新闻包括:2025 开年 3 个月 AI 已经狂飙,更新密集发布;Grok 语音模式全面开放,支持 11 种模式(包括 2 种 18 禁),自带语音字幕,目前仅支持英文。
2025-03-27
aipo现在还能报名吗
AIPO 校园 AI 创投活动的报名情况如下: 10 月 8 日10 月 20 日的活动已结束,当时的报名链接为:https://waytoagi.feishu.cn/share/base/form/shrcnC43n4VFZPurGzoFpu1bHfd 。 2025 年 3 月 13 日的活动,报名方式为通过 3W 点 vtoagi.com,进入创投活动主页,填写报名信息,扫码进群。 3 月 22 日的活动,报名链接为:https://waytoagi.feishu.cn/share/base/form/shrcnodT7ssTzaUNHzY7beyR2tf 。
2025-03-27