万码9L07MMPU
IP:上海
1关注数
26粉丝数
80获得的赞
工作年
编辑资料
链接我:

创作·13

全部
问答
动态
项目
学习
专栏
万码9L07MMPU

DeepSeek-R1

1、介绍: 第一代推理模型,DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero是一个通过大规模强化学习(RL)训练的模型,没有监督微调(SFT)作为初步步骤,在推理方面表现出了出色的表现。有了RL,DeepSeek-R1-Zero自然而然地出现了许多强大而有趣的推理行为。然而,DeepSeek-R1-Zero遇到了挑战,如无休止的重复、可读性差和语言混合。为了解决这些问题并进一步提高推理性能,我们引入了DeepSeek-R1,它包含RL之前的冷启动数据。DeepSeek-R1在数学、代码和推理任务方面实现了与OpenAI-o1相当的性能。为了支持研究界,我们开源了DeepSeek-R1-Zero、DeepSeek-R1以及基于Llama和Qwen的DeepSeek-R1提炼的六个密集模型。DeepSeek-R1-Distill-Qwen-32B在各种基准上都优于OpenAI-o1-mini,为密集模型实现了新的最先进的结果。 2、模型总结: 训练后:基础模型上的大规模强化学习 我们直接将强化学习(RL)应用于基础模型,而不依赖监督微调(SFT)作为初步步骤。这种方法允许模型探索思想链(CoT)来解决复杂问题,从而开发了DeepSeek-R1-Zero。DeepSeek-R1-Zero展示了自我验证、反思和生成长CoT等功能,标志着研究界的一个重要里程碑。值得注意的是,这是第一项公开研究,验证了LLM的推理能力可以纯粹通过RL获得激励,而不需要SFT。这一突破为该领域未来的进步铺平了道路。 我们介绍开发DeepSeek-R1的管道。该管道包含两个RL阶段,旨在发现改进的推理模式并与人类偏好保持一致,以及两个SFT阶段,作为模型推理和非推理能力的种子。我们相信,管道将通过创造更好的模型来造福行业。 蒸馏:较小的模型也可以更强大 我们证明,与通过RL在小型模型上发现的推理模式相比,大型模型的推理模式可以提炼成较小的模型,从而产生更好的性能。开源的DeepSeek-R1及其API将有利于研究界在未来提炼出更好的小型模型。 使用DeepSeek-R1生成的推理数据,我们微调了几个在研究界广泛使用的密集模型。评估结果表明,蒸馏的较小密度模型在基准上表现特别好。我们基于Qwen2.5和Llama3系列向社区开源蒸馏了1.5B、7B、8B、14B、32B和70B检查点。
18
0
0
浏览量60
万码9L07MMPU

minimind

这不仅是一个微型语言模型的实现,更是一份入门 LLM 的教程,旨在降低学习和上手 LLM 的门槛 。它提供了从数据预处理到模型训练、微调和推理的全流程代码和教程。最小模型仅 0.02B 参数,可在普通 GPU 上轻松运行。
7
0
0
浏览量30
万码9L07MMPU

开工大吉,诸事皆宜

酒桌⚱ 饭桌⚈ 麻将桌🀪✨ 🌺不如我的办公桌•‿• 打工人已就位,老板请指示!✌️
26
0
3
浏览量434
万码9L07MMPU

oceanbase

这是源自蚂蚁集团的一款基于 Paxos 协议和分布式架构的企业级分布式关系型数据库。它同时支持 OLTP 和 OLAP 的混合负载,具有高可用、高性能、水平扩展、兼容 SQL 语法等特点。
16
0
0
浏览量50
万码9L07MMPU

大家面试别人流程是怎么样的

1. 自我介绍 3 分钟 2. 介绍一个最有亮点的项目 3. 在他项目里面挑两个难点问问 4. 手写一个多线程通信 5. 手写一个快排
13
0
0
浏览量0
万码9L07MMPU

面试的一些想法和技巧

写在前面 最近一直在面试,之前 gap 过 4 个月,一直在找工作/面试,也算积攒了一下经验,现在分享给大家。 发之前想了很多防杠的提前说明,但是又想了一下,无所谓啦。发出来主要是希望能帮到大家,至于会不会被喷/杠无所谓啦。 面试前 简历编写 最好按照时间从近到远记录项目和公司,确保面试官能看到你最近做的项目。 不要写公司主体,尽量写公司最知名的名字。例如你写上海拉扎斯,谁知道这是饿了么呢? 多写一些关键词,很多 hr 筛选简历的时候基本上都是根据关键词进行匹配的,多写关键词有利于你通过初筛。 写清楚是全日制本科学信网可查,简历上留好电话和微信邮箱等联系方式。很多公司的招聘系统都需要通过邮件发送面试邀约。 项目中可以运用所谓的STAR法则,写清楚项目的背景、难点、解决方案和取得的成果,当然如果有一些部分实在不好写就不写了。 简历优化 个人不建议简历胡编乱造,一个谎言往往要用更多的谎言来弥补,你总有露馅的时候。 但是建议可以适当美化一下,多发掘项目优点,多写自己的贡献。 例如服务并发不高就写自己在代码里面的优雅设计模式,如果代码写的稀烂就写用的什么架构能承担多少 QPS ,避弱就强,多写自己的闪光点,这不算撒谎。 至于简历到底是写多了好还是写好了少,仁者见仁智者见智,我更喜欢的是写的简洁一些,不用花里胡哨的东西,最好做成 pdf ,兼容性更好一些,因为你永远不知道面试过用的 office 还是 wps 。 注意写在简历里面的内容一定要能答得上来,面试官不是傻子,也讨厌别人拿他当傻子 ps:建议面试前查一下公司主营业务,如果面试官问起来可以说了解过贵公司/部门的业务,这样可以争取一定的好感。 简历投递 目前来看,互联网的招聘,主要有平台投递,官网投递,内推投递三种。 内推 这绝对是性价比最高的投递方式,对于用人单位来说来自内部推荐的简历一般会更靠谱,并且效率也会更高一些。个人认为 1 内推=30 海投。 官网投递 一般的大厂都有自己的招聘平台,上面也会有一些岗位,但是按照我个人的经验来看,一般只有大规模校招的时候,hr 团队才可能会看一眼官网投递这个渠道,其他的时候官网投递很容易被 pass 掉,如果你是应届生可以考虑一下这个渠道。 平台招聘 现在比较靠谱的应该只有 BOSS 直聘了,至于拉钩、猎聘之类的基本没有 hr 在用了,当然如果是找外企可以看看领英等等平台。 关于海投 海投是最简单成本最低的方式,但是效率也是最低的。在海投的时候,建议多关注一下 jd 和公司的基础信息,以提高投递效率。 首先,人数 0-99 是的小公司是不建议去的,相信我绝对很坑,不存在小而美。 其次,jd 写的取巧/搞笑/标题党的不要去。 然后,公司名称和上班地点不符的,名字里带人力“人力”、“信息”的小公司或者简介里面有类似的,0-99 人的公司,基本都是外包。 最后,是否选择和猎头合作,见仁见智,反正我从来没在猎头那得到过一个面试机会。 约面 如果面试比较多,建议用各种日程管理工具记录好面试时间和公司名称,最好不要错过面试。 面试中 准备好网络和一个房间,不要让家人出现在摄像头里,提前几分钟进入面试间调试好设备。如果是线下面试最好带一份自己的简历。 自我介绍 一定会有这个问题!!!所以一定要提前准备好!!!!!!!!! 这个自我介绍的作用,一个是面试官需要趁机扫一眼你的简历,另外一个就是需要大概了解一下你的情况。 所以,建议提前准备好自我介绍的内容,主要讲清楚,你是谁?你会啥?几年经验?做过什么业务等等? 这里有一个模板仅供各位参考一下。 «面试官你好,很高兴参见今天这次(对方公司名或者岗位名)的面试。我叫 xxx ,毕业于 yyy 大学 zzz 专业,xx 学历,有 n 年工作经验,曾经做过 xxx ,yyy ,zzz 等业务。 接下来我简单介绍一下我最近工作过的 x 家公司/做过的 n 个项目» «(项目介绍)讲清楚做的什么业务,这个业务是啥?你主要负责什么?» «以上就是我最近情况的一个简介,更多内容都在我的简历里面,谢谢。» 自我介绍也可以多说细节,也可以粗略介绍,不同的面试官有不同的喜好,但是建议多说一些。 最主要是多浪费点时间,一般面试都是固定 1 小时,面试官也有别的安排,个人介绍多一点时间,那八股文和算法拷打部分就容易少一些。如果被面试官打断,就要赶紧切换成简单介绍。 如果你是应届生,主要的介绍要说清楚为了胜任这个岗位,你做了什么。例如面云开发,你可以说自己学习了容器技术,k8s ,网格服务等等。 离职/gap 原因 一定会问!!! 自己提前想好。虽然面试官什么都知道,你也知道面试官什么都知道,面试官也知道你知道他知道...(无限套娃)但是这个世界就是这么癫。 所以我也准备了一个模板。 «上家公司把我调到 xx 岗,该岗位与我自己的职业规划有很大偏差,我希望做的是 yy 方向。(这个 yy 最好是你面试的这个岗位的方向)» «由于身体不好/身体哪里受伤所以修养了一段时间,或者家人哪里需要帮忙等等,算是问到 gap 的时候不会太踩雷的一个答案。» 八股文 必然会问,只是多少的问题。包括但不限于操作系统、网络、数据库、语言等等,根据面试岗位不同而不同。 虽然你知道八股文没啥用,面试官也知道没啥用,你也知道(又开始套娃)...但是一定会问。 这部分除了平时多积累没有别的办法,建议可以多刷脉脉社区或者 B 站的面试视频等等,一定要确保常见/基础的八股文没有问题。 需要注意,会就是会,不会就是不会,不要瞎扯淡。如果问了某个东西不会,可以尝试引导一下话题到你熟悉的内容。 例如可以说:xxx 我确实不太清楚,如果我是设计者我可能会 yyy ,不过对于 zzz 技术我比较了解,您感兴趣的话咱也可以聊聊。 算法题 算法题一般大厂必考,中小厂会选择性的考。 有时候也不是纯算法题,而是会有设计题,例如设计一个 lru 等等。 建议看 b 站 up 主灵茶山艾府的视频,该巨佬视频分为基础算法题和周赛两个类别,视频内容简洁,教学清晰,干货比撒哈拉大沙漠都干。解题思路如德芙巧克力般顺滑,编码实现如庖丁解牛般顺畅。实在是顶礼膜拜,除了牛逼二字再也找不到任何的形容词。 我在学习了这位巨佬的基础算法视频后,在去年 gap 的 4 个月里面了不下 50 次(多为大厂),基本算法通过率在 50%以上。( ps:本人之前真的很菜) 如果只是为了应对一般面试建议看完基础算法系列即可,如果想冲击字节等头部大厂,建议刷完他的全部视频,那应对所谓的算法题如探囊取物。 一般小厂面算法以比较简单/经典的题目为主,主要考察的是编码的熟练程度,例如二分查找/冒泡排序等等。 并且由于很多中小厂买不起在线面试 coding 平台,所以一般会让你共享屏幕开 ide 写,这样有 ide 辅助大家应该会好写一些。并且由于没有很多 case 所以即使写的有点问题大部分情况下也能通过。 大厂一般都是在线编码平台和题库,主要考察算法功底和编码水平。面试任何大厂建议一定要最起码做完并且做熟力扣最常见 150 题。并且建议不要在 hard 水平/2000 序列后的算法题花太多时间,因为性价比不高。 很多大厂,做完算法题一样会挂你。真想要你算法题不会为难你,不想要你一个手写红黑树就把你淘汰了。 在高难度和排序靠后的算法题上倾注太多时间是性价比很低的行为( ps:如果你是字节出来的,一定刷一下接雨水/手动 doge )。 如果是设计类算法题,无他耳唯手熟矣,多刷多背吧。 系统设计题 一般这部分很少问,也都是开放题,没有什么标准答案。但是针对一些常见的系统设计,也可以准备好一个设计方案。 例如: 如何设计一个秒杀系统 如何设计一个短链系统 如果设计一个 ab 实验平台 如何 balabala 这种题目主要考察的是你的全局观和细节能否关注到,一般核心考察的还是并发问题。 面试中,不需要你答对所有题目,因为公司要的不是厉害的人,而是便宜且合适的人。所以在这个时代你需要做个价格低的,而不是技术牛的。 你的预期薪资是多少 如果是 hr 问一般是想了解一下你预期的期间范围,看跟公司的招聘预算是否匹配,因为预算是定死的,一毛钱也不会多给,早一点匹配可以快速筛选出合适的候选人。 如果是一面/二面面试官询问,也可能就是想了解一下行情,方便自己跑路的时候要价? 什么时候能入职? 建议如实说出你的想法就行,有特殊情况的提前沟通。 还有什么想问我的 这是最关键的一个环节,很多人都会忽视什么都不问,这是你能了解这个公司/岗位最好的机会。 建议问清楚以下几个问题: - 这个岗位主要负责什么内容?具体做啥? - 这个岗位所在的组有多少人?总技术人员有多少人? - 面试有几轮?分别是什么角色作为面试官? - 内部协作方式?业务上是专人转岗还是交叉负责? - 其他的,你在意的技术上的点 唯独不建议问面试中没答上来的题目,因为这样会给面试官一个你“不服气”的错觉。 问 hr (可以时候微信询问): - 公积金系数和比例 - 年终奖和绩效考核周期/标准/等级 - 附近租房和外卖是否方便 - 发什么电脑?有没有电脑补助? - 期权/股票?有的话,分几次几年比例? - 加班费/年假/其他福利等等 ps:在这里告诉一个小技巧:不要一下子问 hr 很多问题,因为对方很容易故意不回答某个问题,你可能也不好意思再问一次。所以要一个问题一个问题的发问,这样对方想继续话题就必须回答上面的问题。 关于外包的话题 有些老哥或许没有很高的学历,也没有很好的背景,或者什么都有但是依然拿不到 offer ,考虑去外包不是一件什么丢人的事,都是为了生活。 但是首先,外包并不意味着轻松,虽然有些岗位确实轻松,但是从我混迹社区的经验来说,外包不仅仅是工资底,也完全没有任何地位(没有歧视老哥们的意思),毕竟"外包同学不要偷吃零食"的梗不是空穴来风。 如果非要去外包,还是建议去一些大厂的外包,例如华为 od ,字节外包等等,基建水平会相对完善一下,办公环境也会好很多,薪资也比一般的外包高不少。 其次,现在的环境不用我说也都知道,就算是外包也要求本科起步学信网可查,所以也可以提前准备好学信网截图。 至于专科的老哥,建议仔细考虑一下转行的可行性。(并非歧视,现实确实很难,就我刷 boss 的经历来说很多外包都找过我,要求清一色是统招全日制本科+学信网截图) 拿到 offer 到这就恭喜你上岸了,虽然可能是从一个坑到另一个坑,但是整个世界都是个草台班子,不用太在意。 如果你有多个 offer 拿不准,最好先跟家人商量,再跟网友商量。因为网友不知道你的情况没有上下文,分析的内容可能是不对的或者不适合你。 *** 感谢你读到最后,这篇帖子是我在其他平台看到mark到的,希望对求职找工作的你有所帮助。 *** 如果还没找到工作,快过年了,开开心心给自己放个假吧!
31
4
0
浏览量529
万码9L07MMPU

打工人的一年, 是365天的早高峰和晚高峰, 是无数个加班夜的咖啡香, 是无数次“好的,收到”的回复。 我们用键盘敲击出梦想,用鼠标点击 出希望。 这一年,我们笑过、哭过、累过、也坚持过!
9
0
0
浏览量344
万码9L07MMPU

这一年也并不是一事无成, 至少还有 登录成功、下载成功和支付成功, 当然也有很多不足之处, 主要体现在余额不足和流量不足
16
0
0
浏览量428
万码9L07MMPU

我的生活状态:要么在做梦,要么在发疯,要么在打工🌚
13
0
1
浏览量352
万码9L07MMPU

职场进阶此刻开始!

1.简单记录一天的工作,便于写周/月报。 2. 读书,看电子书,扩展知识面。 3. 戴上耳机听播客、课程或有声书,充实自己。 4.练习公开演讲技巧,提升表达能力。 5. 学习制作PPT,提高工作效率。 6. 尝试副业,培养兴趣。 7.刷招聘网站,了解行业动态。
13
0
0
浏览量306
万码9L07MMPU

中国11月份AI最新排行榜

1️⃣豆包 - 特点:具备出色的多模态能力,尤其在文档阅读、编辑、语音通话、代码编写、图片生成等方面表现卓越。 - 适合用户:需要综合功能、快速响应和大容量输出的用户,如企业办公、内容创作者等。 - 推荐场景:技术文档编辑、多模态内容创作、音乐/视频检索、代码开发。 2️⃣Kimi) - 特点:专注于AI搜索、长文本总结和上下文理解,尤其在网页解析和信息提取方面独树一帜。 - 适合用户:需要长文本处理、信息整合的用户,如研究人员、市场分析人员。 - 推荐场景:长篇文档阅读、信息搜索、知识总结、复杂内容的分析整理。 3️⃣文心一言 - 特点:AI写作能力优异,能高效生成小作文、美文等,理解能力强,适合人机对话。 - 适合用户:创意写作、文案策划、内容创作者。 - 推荐场景:小作文创作、AI互动对话、文章撰写、文案编辑。 4️⃣AIPPT - 特点:在PPT制作上极为出色,能高效设计模板、排版内容,简化了复杂的PPT制作流程。 - 适合用户:经常需要制作PPT的用户,如职场人士、教师、学生。 - 推荐场景:会议汇报、课件制作、项目展示。 5️⃣Gitmind - 特点:导图制作方面的佼佼者,具有高效的信息组织和可视化能力,支持思维扩散和信息整理。 - 适合用户:需要系统性思考和信息梳理的用户,如产品经理、设计师、内容创作者。 - 推荐场景:头脑风暴、项目规划、知识整理。 6️⃣天工 - 特点:音乐生成能力卓越,能够智能生成背景音乐和旋律,为创意音频项目提供支持。 - 适合用户:音乐创作者、音频设计师、多媒体内容创作者。 - 推荐场景:背景音乐生成、音效设计、音频创作。 7️⃣通义 - 特点:在图片生成和编辑领域表现突出,能够生成高质量的图片,适合视觉内容创作。 - 适合用户:设计师、广告策划、视觉创意人员。 - 推荐场景:广告设计、社交媒体图片创作、视觉内容创意。 8️⃣可灵 - 特点:在视频生成和编辑方面居于领先地位,能高效处理视频制作的各个环节。 - 适合用户:视频内容创作者、媒体编辑、市场推广人员。
16
0
5
浏览量731
万码9L07MMPU

AI 真的能代替程序猿吗?

我觉得不会被替代,但是个体的生产力上限会提高。 首先,关于“替代”,正规开发的流程一定也是有人开发有人 review 的,连真人写的代码都需要 review ,AI 的代码一定是不会直接用于生产上的(逻辑类的很难,界面类的勉强可以)。因此程序员还会有,但如果个别人没有适应 AI 写代码,会被淘汰掉。 其次,关于“个体生产力”,这个主要是跨领域(写自己之前不会写的代码)和效率(快速生成可用的代码)。如果是非常熟悉 AI 的人去写代码,总体的上限是提高了的。 最后,还是那个老生常谈的问题,技术不是一门手艺可以吃到老的领域,需要跟上时代进步,不断迭代。
13
0
0
浏览量0
万码9L07MMPU

面试时可以说谎么?各位在面试过程中有过哪些包装?

最近几场面试下来,都不是很满意。在网上看过这样一段内容: «“   有经验的HR识别谎言很容易,通过几个连续性的问题,很容易就让求职者的谎言不攻自破。      要圆一个谎言很容易,但是要连续去为多个谎言去辩解,是比较难的,后来可能无法圆谎时候就会很紧张;当然从体态语言,手势等方式也可辅助分析求职者是否在撒慌。面试的诚信确实是很重要的,这也是很多公司选拔人才的必要条件。      成绩单和学位,是用人单位选拔人才的依据,但并不是唯一的;据调查,在“公司录用毕业生时最重视的因素”的15个选项中,从高到低的前几位分别是综合能力(60%)、性格和态度(53%)、面试时的印象(34%)、所学专业(28%)、学习成绩(14%)、外语水平(12%)。家庭背景、学历层次、毕业学校知名度排在倒数几位。可见学习成绩和外语水平并不是最看重的,而能力和态度是最重要的;诚信是工作态度重要组成部分,所以诚实不但不会带来麻烦,而且可能有助于面试成功。      当然在诚实的基础上适当的包装自己也是有必要的,这是一个提炼加包装的过程,可以提高自己求职的成功率。包装并不是不诚实,而是以更好的面貌展现给用人单位,是成功的关键。”» 对此,大家怎么看?
2
2
0
浏览量362

履历