如何快速理解一切复杂抽象生僻的概念？非常简单，只需三步！｜03/12 days of openai: sora-365bet中文-365bet中文-365dots-365bet亚洲官方

hello 大家好欢迎来到小能熊的知识视频我是小能熊的老陈今天呢是OpenAI双十二 12连发发布会的第三天今天终于把2024年情人节2月14号发布的给大家预览的Sora正式发布了然后不出意外的是我也没用上我们来看一下他的这个发布会我夜里忽然2点就醒了然后我就知道那是我的大脑潜意识当中想看这个发布会

然后我看完之后呢我也没着急用等我登录到Sora上面去的时候因为我是第三方的用Google账号登录的他已经限制我登录了所以整体来讲我觉得关于Sora的信息铺天盖地那我今天要谈的什么东西呢其实我谈的一切都要回到学习上面来我想借Sora这件事情跟大家谈一谈如何快速的去理解一切的复杂概念而且我的解决方案非常的简单

只需要三步我们来给大家看一下我们今天的这个talk要谈的内容我们会去谈理解的本质从认知心理学的原理上来去讲理解的本质它到底是什么然后呢我们会给出我们的这个解决方案并且会用大量的demo 实际的操作要让你看到原来理解像Sora里面的这个Diffusion Transformer呀包括patch等这一系列的概念其实它是非常简单的

而且也非常容易落地的 OK 那我们就言归正传谈今天的内容首先我们来看一看这个Sora 这个东西就是首先要想理解像Sora这样的概念的话其实这里面会涉及到很多一系列这些概念我大概整理了一下大家能看到这是我今天整理了一下跟Sora相关的一些笔记大概会有 20 来个左右的概念这只是我第一天初步的这些整理所以我个人会认为待会我会结合这些实例

跟大家展示一下我们怎么样通过小能熊的费曼学习法来去理解这些技术的一些实质从而能够让我们更好的驾驭好这些先进的技术谈到这一块的时候呢可能很多人会想我们有必要这样去关注吗我们只要知道Sora是个什么东西然后会用不就行了吗这里面呢我给大家讲一个例子吧前几天呢我坐滴滴遇到一个司机然后聊起来之后他就说他女儿8岁很会玩快手

在上面剪视频发视频每天跟小伙伴玩的不亦乐乎在上面有1万多个关粉丝然后言谈之中呢这位大叔他还是挺自豪的但是怎么说呢我觉得这里面有一些误解什么误解呢其实就是说很多时候父母不懂技术然后他看到小孩子玩手机在手机上点点点然后玩游戏玩的特别的溜好像就觉得这个小孩很懂技术很厉害以后不得了很聪明但是我个人会认为这个东西本质上是

孩子对技术他有一种非常幼稚的理解我举个例子有个东西叫亚当斯科技三定律是我这么称呼的它是英国的一个科幻作家叫 Douglas Adams 他最著名的作品其实就是银河系漫游指南很多人应该都看过那里面的小说或者是作品前两天我跟小树一起都读了他的这个小说同时又重看了一下当时二零零几年那部电影我整体会认为亚当斯的科技三定律特别有意思怎么说呢

一言以蔽之其实就是我们对于科技的态度很多时候呢就是假如说这个技术是你在15岁以前所诞生的接触到的你会觉得这一切理所当然它天然就是存在的就跟太阳一样它天然就存在了你不需要去了解背后它到底跟你有什么关系它为什么存在它背后的原理是什么然后呢在我们15到35岁之间我们接触到的技术我们会觉得它都是改变世界的然后呢在我们35岁以后接触到一个新的技术比如像Sora

ChatGPT 很多人就会觉得这是大逆不道的这个背后其实是我们对于科技的态度而我们都知道其实现在这个世界这个社会在本质上是被技术所塑造和驱动的是被科学和技术所驱动的所以如果小孩也好大人也好对技术抱着一种很幼稚的理解会玩游戏会玩抖音快手什么之类的但实际上可能打字键盘盲打都不会然后编程也不会这个东西真的是懂技术吗

很多时候当你对技术停留在幼稚的理解的时候看似是你在使用技术而或许实际上你才是产品你才是被技术使用所改造的我现在还没有用上Sora 因为流量太大我暂时还没用上但是我是plus用户我觉得肯定是可以很快用上的而且小树也特别期待这个Sora 把她自己的脑子故事变成这种视觉化的形式所以我预计到我们以后会一起来去玩这个东西后面呢我会跟大家来分享但是今天呢我想跟大家谈的是什么呢

就是以Sora为例我们谈一谈如何去快速的理解这些复杂的抽象的生僻的跟生活有一定的距离的这些科学的概念所以这里面就涉及到理解这个事到底什么叫理解就是大家经常会在孩子放学了之后家长就会问今天老师讲的课你听懂了吗老师讲的你都理解了吗孩子就会说都会都理解了但是你让他真的去费曼出来用自己的话讲出来你会发现不论大人和小孩

很多时候自己以为的理解并不是真的理解所以这个时候其实就是我们来去探讨一下理解的本质到底是什么所以用一句话来概括我认为理解的本质它其实就是在清晰准确的知识砖块之间主要是概念你可以理解为在清晰准确的概念之间建立丰富有意义的知识关联然后呢你通过费曼X3

一遍两遍三遍的费曼最终能够用自己的话表述出来能够举实例能够打比方能够应用能够用它来解释世界解决问题这个时候我们就称之为理解以Sora为例你会看到 Sora跟扩散模型世界模拟 Transformer DiT 建模再描述多模态 OpenAI 文生视频这个视频生成模型特征 latent space 潜在空间概念图谱时空补丁视觉补丁这一系列的这些统一表征

这些概念之间你的清晰准确的概念越多相互之间的关联越有意义越丰富在这个前提之上你才能够把这些概念给他费曼出来所以我们来看一下我这里面整个我有5,742个笔记 11,971 个链接所以你可以理解为我的这个5,700多个笔记再加上12,000个链接

它们这个一个一个的概念概念之间的丰富的联结它就构成了我的一个概念空间在这概念空间里面五六千个概念以及之间的上万的这个联结它实际上是我能够费曼清楚一个概念的前提和基础 OK 所以我觉得应该很具体形象了吧所以这里面我觉得很需要去强调的一个事情是什么呢其实就是说因为中文

实际上是一种很讲究意合的语言所以呢这种语言呢会影响我们整个思维方式吧所以很多时候呢我们讲究意和就不像英语过于的强调清晰准确所以我们很多时候对很多东西的理解呢就是那种感觉就是那种感觉那种意会的东西大家很多时候会觉得我们高级的东西是不能言说的只可意会不可言传但是实际上我们基于这个认知原理的话

我们就会知道就任何一个东西如果我们不能用语言清晰准确地表述出来那其实你可能就并不是真的理解所以我觉得在现实当中存在一种很重要的一个现象就是我们知道一个东西的名字知道了很久知道了很多年但是我们不一定真的理解这其中的概念例如ChatGPT 你知道它的名字叫ChatGPT 但是 GPT什么是G 什么是P 什么是T 它整个的how does it work 这个GPT整个的运作的原理是什么

很多时候大家并不会真的去了解所以Sora也好 GPT也好很多时候我们如果不能费曼的话其实就并不是真正的理解这个概念我认为看起来好像知道名字也算是一种懂一种理解但实际上它跟真正的理解是天差地别的他是人与人之间在认知上面的一种本质的差异也是人跟人之间存在重大差异的一个很重要的原因王小波说过一句话人跟人之间的差别比人跟猪之间的差别还要大

这是一个笑话但是在认知层面上我觉得还是有他的这个解释力的然后呢我们今天的主题是理解复杂的概念很简单只需要三步第一步就是你要去构建并且积累知识砖块第二步呢其实就是你要在知识砖块之间建立丰富有意义的关联第三步就是什么呢费曼费曼再费曼今天会用详细的我的笔记的例子来去给你真实的展示我相信你看完这个之后

我觉得会非常的好落地我们来先谈一下知识砖块这个事知识砖块跟知识关联这两个东西呢是我的一种提法为什么这么提呢是因为在我的logseq笔记里面五六千个笔记里面它只有两种砖块的类型一种是概念一种是idea 大概就是一句话吧所谓的idea 其实就是这个概念之间形成的有意义的联结例如费曼是一个概念诺贝尔物理学奖是个概念

费曼得了诺贝尔物理学奖这就是一个idea 当然这也可以说这是一个事实性的知识但是呢如果是概念性的这种关联他就形成了一种思想例如概念是费曼学习法的第一公民这其实就是一种思想所以大家会看到了就是说我之所以这个笔记里面主要就是概念就是因为在小能熊的费曼学习法当中概念是第一公民是最重要的东西就是我的电脑里面平时我学习的这个对象也主要就是概念

然后呢概念之间的关联就形成了idea 我要demo一个 Sora和统一表征之间的这个关系我们来看一下我会交叉使用 logseq和Obsidian 为什么呢因为Obsidian 它的这个graph的形式比较好看并且呢它有更灵活的操作性并且呢它的整个的渲染的这个效果更强就是它的性能更强所以大家会看到 Sora这样的一个概念 Sora这个笔记

我通过2W2H的一个结构然后呢这是一个笔记的一个初步的版本这里面呢出现了一系列的词像OpenAI它其实就是一个概念然后像这个文生视频的模型或者叫视频生成模型这也是一个概念什么叫多模态什么叫生成式AI 很多时候呢如果你觉得这个概念是你以后一再会遇到的它是一个比较有信息量的对于你构建知识体系是有用的你就应该把它变成一个单独的一个概念的笔记所以那我这些概念他是怎么样去得到的呢我们来举一个例子

我们来看一下就是我平时的阅读觉得只要任何值得读的东西它都要读五六七八遍我在我的这个七八千个文章里面打了Sora标签的其实就是我过去这10个月里面积攒的跟Sora有关的这个主题的内容然后你看就假如说这篇文章这篇文章是我自己今天新收集的大西洋周刊他关于Sora的一篇文章其实如果我读的话我在这里面划线

然后写笔记最终呢我会把我的这个阅读的内容整理成 logseq里面的一系列的概念的笔记然后你看这个包括今天Sora的博客文章和他的这个系统报告什么之类的东西甚至我跟ChatGPT聊天的主题例如你看我把我今天Sora的system card和tech report 把它放到ChatGPT里面去跟GPT聊天聊完之后呢其实我会把这个里面整个内容用readwise来剪藏一下

剪藏到这里面之后呢其实我就可以重读很多很多遍了然后我也可以从这里面去划线提取相关的概念笔记了所以我个人会认为这种主题阅读它是我们的知识砖块的一个来源然后呢利用这个ChatGPT 我就可以建立知识砖块的第一个版本所以给大家看一下这个demo一下就是这个版本这个DiT diffusion Transformer 扩散变换器扩散模型跟Transformer 这两个东西的结合

是这个Sora的一个底层的技术这个概念它对于我们理解Sora的运行的原理是非常重要的但是很多时候你没有必要第一步去谷歌谷歌出来一些东西之后看看又看不动然后最终就放弃了其实很简单的方式是什么呢很简单的方式其实就是我让他解释一下 diffusion transformer这个概念 DiT这个概念它解释完之后呢我给它复制粘贴过来它就形成了我对于这个概念的一个初步的了解然后我在读的过程当中

我在迭代这个笔记的过程当中呢我就会把这些概念转换成相关的概念笔记然后这里面呢因为我的这个模板里面还涉及了一些重要性的权重和这个阶段就是所谓的这个常青笔记嘛我设计了两个维度的标签体系一个是从它的生长阶段种子阶段萌芽阶段抽条阶段开花阶段常青阶段这是一个用来描述这个笔记的成熟度的

这样的一套标签体系重要性呢我就按照 level 1到 level 5 我又定了另外一个标签体系这个其实就是我们今天所谈到的这个概念的重要性然后呢在砖块之后建立关联我给大家举个例子吧就是其实我们在logseq和Obsidian中都可以很方便的建立关联我们先来看在logseq当中怎么样去建立关联就举一个刚才的这个例子吧你看这里面就是扩散模型

然后你看你整理第一个版本的这个扩散模型的笔记的时候呢其实你就可以很方便的去建立一个新的笔记链接然后这又是一个新的概念笔记而且假如数据分布这个东西在你原来的电脑里面是存在的然后它就会自动跳到对应的这个笔记里面去然后你会发现这个数据分布实际上是来自于sam altman的智能宣言当时我在翻译这篇文章

以及阅读这篇文章的时候我去做了条笔记然后现在呢我又看到数据分布这一个笔记在几个地方都出现了包括savage的这个书的章节里面包括扩散模型里面包括这个《智能时代宣言》好几个地方都出现了所以你会发现这就是我们在迭代我们笔记的过程当中自然而然就在这个笔记之间去建立了关联了然后呢在Obsidian里面迭代其实也是比较方便的

我们举个例子假如说这个统一表征这样的一个概念笔记这是同样一个markdown文档我在logseq或者是在 Obsidian里面打开它都是一样的所以我们举个例子吧你看就是在Obsidian里面写这个笔记的时候它有一个优势什么优势呢其实就是我们举个例子我们把这个原来的笔记给它去掉就当你发现这里面识别了这里面的一个概念这概念很重要的时候然后呢你切换到英文输入法

你输入的时候然后你光标移动的时候它就会自动在你的这个 5,000多个笔记里面去搜索搜索之后它就相当于自动补全一样你只要一回车它自动就在这个里面去建立了一个名叫潜在空间的这样的一个概念然后再点开他就会打开所以基本上就是这样子的所以呢建立知识关联的时候它其实是非常非常的方便的

所以它这样的话更多就是一种思考的过程在你笔整理笔记的时候它也是思考的一个过程刚才我提到了在Obsidian当中去建立笔记关联的时候它比较方便的一点是它能够自动搜索并且补全而不那么方便的一点呢就是它的这个tag page的机制跟logseq不太一样例如潜在空间对你看我刚才输这个潜在空间的时候在logseq里面自动就会跳到latent space这个笔记页面

但是呢在Obsidian里面它会自动打开一个新的页面就是因为logseq跟Obsidian的这个处理的机制不一样就是说在logseq里面我有这么一个 alias 别名的这样的一个属性所以呢这一个笔记它有好几个名称不论多少个名称它都会指向同一个实体同一个内容就好像给一个实体起了好几个变量一样但是呢这个在Obsidian里面它是不认的所以它就会导致会产生一个新的空的

名叫潜在空间的一个笔记这一点其实是我们注意一下就行了他可以很好的避免然后呢到第三步的时候你发现我们有知识砖块了我们有知识关联了第三步的时候呢其实就是我们在平时遇到的时候你会搜索到你的笔记你重读你可能在文章当中需要用或者你要跟别人讲的时候需要用就根据你在现实生活当中的

一个实际的需求你就会费曼一遍或者你每天新建5个笔记再迭代5个笔记这过程你也会再费曼一遍所以你就是通过费曼费曼再费曼这个过程当中呢你在你自己的脑子里面这些概念就变得更加的清晰了然后呢在这个笔记当中这些看得见摸得着的笔记的关联也就会变得更多了然后我这边之前设计了一个demo

是什么呢就这个统一表征所以你看到跟Sora建立关联的笔记有这么多然后呢跟统一表征建立关联的有这么多如果我们在一个新的page里面打开你会看到这里面其实是毫无疑问这是我从ChatGPT里面copy过来的一个笔记但是呢我经过了我自己的编辑加工然后呢他就会有比较丰富的关联然后我们在Obsidian里面它其实可以打开一个graph view 就是Obsidian里面有两种graph view

一种graph view是全局的graph view 就是你的五六千个笔记和1万多个关联另外一个graph view呢其实就是所谓的local graph view 你就会看到这个统一表针它跟好几个东西建立了这个相互的关联如果你能够把统一表征跟潜在空间什么关系跟概念图谱什么关系跟Sora什么关系跟时空补丁什么关系跟token什么关系跟这个latent space 跟这个Transformer 跟这个video patch分别有什么关系

你能够用自己的话来说出来的话其实你就非常的理解这一概念了我觉得理解这些概念理解背后的why 对于我们以后的使用它是非常重要的说到底其实就是说如果我们思维比较简单思考都比较浅层那工具再先进我们真的能够真正驾驭吗然后还要demo一个东西是什么呢 demo就是在记笔记的时候有一个特别方便的一点

就是说我在这里面打一个card的这个tag 它就会自动变成了一个记忆卡片所以你会看到我在这里面它就出现了然后我就在想这个潜在空间可以帮助我们学习隐藏特征这是怎么回事呢我能举个例子吗我能给他解释清楚吗然后你会发现这不就是我们这里面记的笔记之一嘛所以

大家会看到我今天要讲的idea 实际上是非常非常简单的说实在的就是我觉得太简单了我都有点不好意思但是呢我想跟大家说的是根据我的观察虽然我这个方法是极其的简单就是我们要积攒我们的知识砖块我们在知识砖块之间建立丰富的关联然后呢我们费曼费曼再费曼但是我想说的是在现实生活当中就是大家对复杂的概念缺乏理解或者是很长的时间

都很难深入的理解和掌握一些复杂的概念最终导致脑子里面缺乏概念概念混淆然后呢最终的问题就是缺什么就想去找补什么就是因为你特别的缺乏清晰准确的概念概念混淆所以你老容易被那些生造概念的人被那些耍大词的人什么认知折叠这一类的东西所吸引和迷惑所以到最后如果我们只是知道很多东西的名字

但是我们并不真的理解它并不理解概念的话那实际上我们的头脑会最终一团浆糊我们就会不可避免的成为一个思维迟钝认知上很处于弱势的这样的一种状态也就是2024年牛津词典它提炼的一个年度关键词叫什么叫 brain rot 叫坏脑症什么叫坏脑症它指的其实就是当我们在互联网上看了太多很trivial

很琐碎的然后呢低质量的没啥营养的这些的信息最终导致我们的思维状态导致我们的认知水平导致我们的智识水平停留在那样一种状态所谓的brain rot那么一种状态所以坏脑症我觉得坏脑坏在什么地方坏就坏在我们缺乏足够多清晰准确的理解缺乏对事物有深刻的本质的认识所以今天整个给大家来去demo的东西呢

其实我还想跟大家做一个很简单的一个总结其实就是毫无疑问在这整个过程当中你会看到logseq对于积累概念以及在概念之间建立关联它是多么的符合认知原理而且我觉得他的认知负荷对于一个小孩来讲他都是非常非常容易的总之小树去年看到我在使用logseq的时候她就特别的来劲让我给她安装了之后她就自己用她都不让我教她为什么因为她自己就会玩

然后她记了很多一直到现在还在记用它来去记C++的笔记记Python的笔记所以我个人会认为它是又符合认知原理然后呢它的这个认知负荷又极其的低哪怕是一个8岁的小孩都能用的很开心然后呢在用的过程当中呢它又能够不断的给你去建立正反馈例如如果你能够把这个像Sora这样的一种复杂的概念讲的很清楚那是一种非常让人心情愉快的一种行为并且呢当你能够看到你的这个学习卓有成效

进一步有进一步的欢喜每积攒一个概念你就变得更聪明一丢丢这是一个多么让人快乐的一件事情然后另外呢我想跟大家强调一点就是说我的主张是 logseq跟Obsidian来去搭配使用因为这两个工具本质上是一样的唯独的区别其实就是logseq 它整个的笔记的结构都是以一个一个的节点来去组织起来的它是一种树状的一个结构而Obsidian呢它实际上都是在里面是写文章的所以我基本上不用Obsidian来去写

但是呢我会用Obsidian比较丰富的插件的生态以及它比较高性能的客户端来去做一个另外一个展示所以这两个相互搭配它就能够起到1+1大于2 1+1=11的这样的一种效果好这个呢其实就是我今天想要跟大家谈的这个主题所以我没有具体讲Sora 因为我现在还没有用上但是后面我觉得随着我使用经验的积累我们大家还是可以进一步探讨怎么样去用Sora 把自己的故事进行一种非常生动的

视觉化的来表达但现在呢我们其实就是借Sora这么一个主题来去跟你探讨如何快速的去理解一切复杂的概念非常简单只需要三步非常感谢你的时间谢谢

如何快速理解一切复杂抽象生僻的概念？非常简单，只需三步！｜03/12 days of openai: sora

相关推荐

【阿尼亚斯贝(Agnès B.)】是什么牌子

世界杯赌球“黑产”揭秘：下注者陷入漩涡，躺赢的永远是它…

4、洛克王国哪里经验最多

合作伙伴