国内AI大模型的封神榜;我有PDF翻译秘诀, 8种!AI开发者半年心路与经验分享;2023年中国AIGC产业全景报告;GitHub Copilot官方入门课;

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🉑 Heygen 注销中国公司主体,探索出海新范式

https://www.heygen.com/

HeyGen 是什么

简单来说,HeyGen 是一个国产AI视频生成工具,几个月前因为「泰勒·斯威夫特说中文」「郭德纲表演英文相声」等视频片段爆火出圈,受到了国内和海外用户的关注和追捧,网站流量增长达到了 92%

HeyGen 让人印象深刻的点有两个:一是生成视频的效果非常逼真,郭德纲用自己的音色说着地道英语时,口型甚至都能准确对上,让人眼前一亮;二是只需要几秒钟的视频素材就可以确保生成效果,而其他同类产品需要的视频素材 20-30 分钟起步。

https://www.forbes.com/sites/kenrickcai/2023/11/29/ai-video-startup-heygen-launches-near-instant-avatar-generator-adds-56-million-in-funding/

2022年7月推出到2023年3月实现 100 万美元 ARR (Annual Recurring Revenue) 里程碑,只用了几个月。10月份这个数字增长到 1000 万美元11月时已经飙升到了 1800 万美元。HeyGen 的发展可谓一路蒸蒸日上!

12月初,突然传出 **HeyGen 注销中国公司主体「诗云科技」**的消息。天眼查证实:自2023年12月11日起,诗云科技因决议解散,拟向公司登记机关申请注销登记,债权人需自公告之日起 45 日内向清算组申报债权。

目前,HeyGen 登录和使用,已经需要魔法。这家由中国人创办的AI科技公司,已经毅然转身选择「归海」。

一路高歌猛进发展时,这样的操作是出于什么考虑?目前来看,这很可能与其最新一轮融资有关。

11月29日,HeyGen 拿到了 Conviction Partners 领投的新一轮风险投资 560万美元,硅谷投资家 Sarah Guo 也参与其中。这轮海外融资后,公司估值已经达到 7500 万美元。作为交易的一部分,Sarah Guo 接替了红杉中国在 HeyGen 董事会的席位

也就是说,HeyGen 为了更顺利地开启「全球化」进程,减少中国色彩,采取了多项措施,注销中国公司主体是其中的一部分。

有 TikTok 前车之鉴,国内公司出海时,为了更好地接触海外客户、更容易地寻求海外资金支持、获得更多的政府税收支持、减少数据方面的审查针对等,制定这类国际扩张战略可能是一种新的范式 ⋙ 更深度地探讨这个话题

👀 Sam Altman 最新采访:首次公开谈论宫斗,还辣评 Elon Musk 和 Google Gemini

https://time.com/6342827/ceo-of-the-year-2023-sam-altman/

12月初,OpenAI 那场吸引了全世界目光的「惊魂宫斗」刚刚平息,Sam Altman刚刚重回 CEO 岗位,时代杂志 (TIME) 就宣布评选他为2023年「CEO OF THE YEAR」

emmm怎么说呢,卡在这个时间点上,感觉上多少有点「揶揄」的意味 😄

不过,时代杂志这篇专题报道 (👆链接如上) 非常完整且充分地说明了评选的理由:从 YC 到 OpenAI,Sam Altman 用他天才的商业头脑在一步步推动世界的改变,夸张点说,「他以一己之力带领世界进入了 AGI 时代」

这篇文章从 Sam 高中时讲起,展示了他在上学和 YC 的成长历程,并且细致地描述了他与 Musk 一起招兵买马建立 OpenAI 的诸多细节,以及 ChatGPT 发布后一年时间里带给世界的巨大变化。当然,对于「狗血」内部动荡的始末,包括淡出公众视野后的内部处理,文章也记录地非常完整。

非常棒的一篇文章,不愧是 TIME。读完后对 Sam Altman 的了解立体了很多 ⋙ 阅读这篇报道的中文翻译版

https://www.bilibili.com/video/BV1Tc411y7v5

随后,Sam Altman 现身 TIME 组织的「A Year in TIME」活动,并接受了杂志主编 Sam Jacobs (右) 的采访。

B站已经有中英文字幕的采访视频,共15分钟,👆 链接如上

这场采访给我留下深刻印象的点有两个,一是主编的问题真的都!好!刁!钻!二是 Altman 畅想 AGI 时语气都变了,感觉他真的看到了未来所以特别坚定。

日报整理大家可能比较关心的4个问答,更多内容可以查看原视频,主编一边提问一边挖坑到最后一刻hhh

Q:what the hell happened (到底啥情况啊)?

A:(卡住并笑了) 公司的事吸引了大量关注,但其实并没有大家以为的那么严重,可以说是 OpenAI 在一年之内急速发展的某种「必然结果」,是积累地各种压力和矛盾的彻底爆发。

在追求 AGI 的路上,我们对这类事情的发生有思想准备,但没想到来的这么快

Q:你个人从中的收获是什么?

A:还没来得及重新思考,也没时间梳理个人情绪,重返 CEO 岗位后一直在收拾烂摊子。不过在我无法和团队成员直接沟通的时候,他们依然能在重重压力之下保持着出色的工作表现,这令我非常自豪。

……我们必须做出改变,必须改变我们的治理结构,以及与这个世界互动的方式。

Q:Elon Musk 评价 OpenAI 变成了一家不 open 且追求利润最大化的商业化公司,还成为了微软的傀儡,这些是真的么?

A:都不是。OpenAI 已经并将继续开源更多内容,对利润追求保持克制,也不是完全由微软摆布

尽管他持续抨击 OpenAI,但那并不是真相。我个人感激 Elon 的贡献,因为他对电动汽车和星际探索领域的开拓是非常重要的。

Q:Google 发布了 Gemini 并生成在多项测试中性能优于 GPT-4,他们为什么花了这么长时间才走到这里?

A:AI是人类最重要的发明之一,有更多的人参与其中是好事。Gemini Ultra 明年发布后我们再对其进行评价。

there’s been a lot of confusion around the metrics, but I’m sure Google will do great work

🉑 如何翻译一整份 PDF?这8种解决方案亲测好用,果断收藏!

https://weibo.com/1687198333/NwLaEwMXp

怎么把一份英文 PDF 完整地翻译成中文呢?相信这是很多小伙伴的实际需求,而且ShowMeAI 社群里也时不时就会冒出这个话题。

微博@严峰 老师前几天也发博征集解决方案,网友们在评论区提出了很多自己在用的「小工具」「小妙招」,都非常实用!日报将其分类整理一下。

注意!有些是需要付费的,大家酌情探索和选择使用~

🔔 一致好评组

DeepL

https://www.deepl.com/translator

网站

点击页面「翻译文件」按钮,上传PDF、Word或PowerPoint文件即可

immersive 沉浸式翻译

https://immersivetranslate.com

浏览器插件

安装插件后,点击插件底部「更多」按钮,选择「制作双语BPUB电子书」、「翻译本地PDF文件」、「翻译THML / TXT文件」、「翻译本地字幕文件」

calibre

https://calibre-ebook.com/zh_CN

下载并安装 calibre 电子书管理应用,并安装翻译插件「Ebook Translator」

🔔 专职翻译组

Google Translate 谷歌翻译

https://translate.google.com/

网页

使用工具把 PDF 转成Word,再点击谷歌翻译「Document」按钮,上传 Word 文档

百度翻译

https://fanyi.baidu.com/

网页

点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)

彩云小译

App

下载后点击「文档翻译」,可以直接导入PDF、PDF、Word、Excel、PPT、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)

🔔 剑走偏锋组

微信读书

App

下载App后将PDF文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮

浏览器自带的翻译功能

如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能

🉑 李博杰:国内AI大模型,这4家是最有希望的 (目前)

https://www.zhihu.com/question/608763410/answer/3327836302

李博杰是谁?

他是中科大少年班的成员,曾在SIGCOMM、SOSP、NSDI、ATC、PLDI等多个计算机国际顶会上发表多篇论文。

他是华为2012实验室原成员,职级20 (技术专家A级别),2019年第一批加入华为的「天才少年」

离职前,他是2012实验室下属计算机网络与协议实验室助理科学家、副首席专家。

他还是一名活跃的知乎人工智能领域答主,最近几个月创业有了更多信息源和他洞察。上周他的一篇回答是探讨目前国内最有希望的大模型企业,以及同赛道里大厂和创业公司们的生死命门。非常精彩。

结论:国内大模型企业,他最看好字节、百度、月之暗面 Moonshot、智谱,并「大笔一挥」写下了大模型厂商们的「死亡笔记」。

日报整理了结论和解释的核心要点,非常推荐前往知乎阅读原文 (👆上方链接)!以及答案的评论区也很有「料」哦~

字节:有最多的多模态中文私有数据,有 OpenAI 的研究科学家,有很多 GPU 资源,有落地场景

百度:有先发优势,顶层重视程度高,有很多文本数据积累

Moonshot:国内大模型初创公司的代表,有比较专业且和谐的团队,有非常 sharp 的技术观点;缺点是融资额相对不高,以及GPU 资源可能尚不足以训练 GPT-4

智谱:国内 to B 领域大模型创业公司的代表,营收比较有保障,融资额较大 (GPU 到位后足够训练 GPT-4 这种级别的模型)

🔔 一些大实话

模型性能:GPT-4 ≥ 百度 > 字节 / Moonshot > GPT-3.5 > 智谱 ChatGLM

目前百度大模型已经达到 GPT-3.5 和 GPT-4 之间的水平,部分中文能力已经达到 GPT-4

字节大模型发的加速度比较大

初创公司已经发布的大模型中,只有 Moonshot 的模型水平超过了 GPT-3.5

智谱 ChatGLM 目前公开模型的水平尚未全面达到 GPT-3.5

阿里、腾讯、华为目前发布的大模型水平,还不如百度和字节,以及腾讯有可能收购一家大模型公司

很多中文大模型都是在 LLaMA 基础上做了 continue pretraining,加上一些中文语料就变成中文大模型了;使用 LLaMA 的架构,从头开始收集和清洗数据做 pretrain 已经是 top 创业公司才能搞定的了

🔔 大厂最容易出现的问题

资源碎片化,内部赛马浪费大量资源

部门墙厚,做大模型的部门拿不到数据

不在一线的资深专家指挥一线的年轻专家,技术方案不够接地气

锁死在公司现有的业务场景

只抄袭别人的架构,没有自己的创新

另一个极端,盲目追求创新又没有足够深入的思考,结果掉坑里了

全线出击,结果一个都没搞成:既要搞 GPT-4,又要搞多模态,还要搞长上下文,做文本的和多模态的还是两拨人;既要搞 to B,又要搞 to C,既要国内市场,又要海外市场

买不到/租不到 GPU

🔔 创业公司最容易出现的问题

Founder dispute,核心成员之间发生宫斗,创业公司最可怕的问题

如果公司里有很多资深大厂经验的人,很有可能患上大公司病

数据、算法、Infra 三个方向都很重要,能在三个方向上都招到靠谱的人,是很不容易的

技术不够成熟就急于发布,损害公司声誉

如果一个公司总是担心自己的业务 OpenAI 做了怎么办,那就说明技术护城河还不够深

创始人不懂技术,看不懂 paper 就很难 follow 大模型领域最新的进展,很容易失去耐心

买不到/租不到 GPU

盲目扩张规模,不仅容易导致有限的资金很快被烧光,还容易导致人浮于事,患上大公司病

拉不到下一轮投资

👀 AI开发者六个月「血泪」历程:这10件事真是万万没想到

https://makeartwithpython.com/blog/thoughts-on-generative-ai/

作者是一位AI开发者,有着15年的后端开发经验,开发了一款生成式AI视频编辑器已经六个多月了。可以说,他亲历了大模型发展最突飞猛进的几个月,这极大冲击了他最初的预想。

时至今日,这位开发者依旧不清楚下一代应用长什么样 (实际上大家都不知道)。不过他在这篇文章里总结了10条印象最深刻的感悟

道德在构建AI产品时是首要的商业和产品关注点:在开发AI产品时,需要考虑道德和伦理问题,例如在使用 DeepFake 技术(如换脸、克隆声音等)时,要确保用户在道德和法律层面的责任

模型实际上并不重要,因为更好的模型下周就会出现:在实践中,模型本身并不重要,关键在于构建工具和接口,以及使用可互换的模型;开发者应该致力于利用现有模型构建更好的用户体验

即将到来的未来可能会很奇怪:互联网上的内容将越来越难以区分是人类还是机器生成的,这将对社会产生深远影响

开源处于根本上较弱的位置:硬件成本、数据集规模和网络带宽限制等资源限制,都是开源发展的障碍

现有企业有强大的优势:大型公司在资本和数据方面具有优势,可以利用现有的资源和基础设施,更快地开发和部署AI应用

我们不知道护城河会在哪里:目前尚不清楚哪些公司将建立起生成式AI领域的持久竞争优势,比如技术、硬件、数据、商业模式等

机器人可能是下一个护城河:随着机器人技术的发展,模拟和训练环境将成为关键的竞争领域

没有人能跟上进步的步伐:AI领域的进步速度非常快,即使是最聪明的人也难以跟上,开发者需要学会如何在不断变化的环境中保持关注和适应

开发者需要关注模型的实际应用和用户体验在评估大型语言模型的性能时,很多时候需要依赖直觉和主观判断,并没有绝对的衡量标准

保密和安全问题比通常更为重要:保护AI模型的权重和数据对于公司的成功至关重要,这也使得保密和安全问题变得更加重要

👀 艾瑞咨询 | 2023年中国AIGC产业全景报告

ShowMeAI知识星球资源编码:R203

这是艾瑞咨询最新发布的一份 AIGC 报告,共69页,系统梳理了大模型层、应用层、算力层的发展现状,中国AIGC标杆企业,以及对未来的发展趋势预测。

艾瑞咨询预测,2023年中国AIGC产业规模约为143亿元,随后进入大模型培育期,持续打造与完善底层算力基建、大模型商店平台等新型基础设施,以此孕育成熟技术与产品形态并将其对外输出。预计 2030年中国AIGC产业规模有望突破万亿元,达到11441亿元。

以下是报告关键页面,非常推荐仔细查看并阅读报告原文:

🉑 微软最新AI系列课:10小时,学会与GitHub Copilot 结对编程

https://github.com/microsoft/Mastering-GitHub-Copilot-for-Paired-Programming

这是微软最新发布的「GitHub Copilot」技能课,帮助学会与这一 AI 神器结对编程,释放更强大的编程力量。10小时的课程学完后,可以实现以下目标:

浏览基本的设置过程,并且学会使用 Visual Studio Code 和 GitHub Copilot Chat 进行实时协作

深入研究 GitHub Copilot 各种功能,比如自动完成、可定制功能、高级编程技术

课程量身定制了最佳实践环节,可以帮助学习者提高代码质量

体验最新人工智能技术与配对编程的融合

GitHub 简介:了解仓库、分支、提交和拉取请求的基本概念

GitHub Codespaces 简介:使用 GitHub Codespaces 和 Visual Studio Code 进行代码开发!学习如何创建代码空间、从代码空间推送代码、选择自定义镜像以及定制代码空间

GitHub Copilot 简介:GitHub Copilot 可以在编写代码时提供自动补全式的建议,并直接在 VS Code 和 Codespaces 中使用

使用 GitHub Copilot 与 JavaScript:在 Visual Studio Code 中启用 GitHub Copilot 扩展 → 制作提示从 GitHub Copilot 生成有用的建议 → 使用 GitHub Copilot
改进 JavaScript 项目

使用 GitHub Copilot 与 Python:在 Visual Studio Code 中启用 GitHub Copilot 扩展 → 制作提示从 GitHub Copilot 生成有用的建议 → 使用 GitHub Copilot 改进
Python 项目

使用 GitHub Copilot 创建迷你游戏:制作提示从 GitHub Copilot 生成有用的建议 → 整合游戏逻辑并改进您的 Python 游戏

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

​ 

Read More 

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *