万码BPKPWE8Y

IP:上海

0关注数

20粉丝数

37获得的赞

天津大学

硕士

工作16年

编辑资料

链接我:

创作·25

全部

问答

动态

项目

学习

专栏

万码BPKPWE8Y

双非电子信息硕士女是不是只能家里蹲啊？

目前今年的环境是这样的，学校学习的东西和实际工作有所出入是正常的，先试试比较流行的大模型和AI比较好的赛道各种初创公司比较多，目前很多外企也开放有很多外包的岗位，可以多尝试一下，有机会转正，今年的优先级一定是苟住，然后多储备自己的能力，多尝试吧

浏览量0

万码BPKPWE8Y

AI方向，学习c还是python，求大神指点？

首先业务层面的AI方向，优先学习python，入门快，框架多，tensorflow和pytorch等可以快速完成模型的学习和训练等任务易学性：Python语法简洁明了，对于初学者来说非常友好，可以让你更快地入门编程。社区支持：Python拥有庞大的开发者社区和丰富的资源，包括大量的教程、文档和开源项目。库和框架：Python在AI领域有着无可比拟的优势，有许多强大的库和框架支持，如TensorFlow、PyTorch、Keras等，这些工具大大简化了机器学习和深度学习模型的构建过程。应用广泛：Python不仅用于AI，还广泛应用于Web开发、数据科学、自动化脚本等多个领域，这使得Python成为一门非常实用的语言但是对于真实的工业场景下，比如检测任务，以及工业故障等，c++基本已经是唯一的方案，优先需要考虑到效率和性能上的表现同时对于科技企业来说，尤其是大厂,比如英伟达等企业，需要更多底层优化的建设，各有优缺点性能：C语言执行效率高，适合对性能有极高要求的应用场景。如果你需要处理大量数据或实时计算，C可能是一个更好的选择。底层控制：C语言提供了更直接的内存管理和硬件交互能力，这对于某些特定的AI应用（比如嵌入式系统中的AI）非常重要。学习曲线：与Python相比，C的学习曲线更为陡峭，需要更多的时间来掌握其语法和最佳实践。库支持：虽然也有不少优秀的AI库支持C/C++（例如Dlib、OpenCV等），但相较于Python，它们的数量太少了

浏览量0

万码BPKPWE8Y

AI识图的功能推荐用哪个模型

如果仅仅为对AI的文本做提取，可以推荐使用千问2VL模型，提取对应的文本信息如果需要识别图片的内容，并且对内容进行理解和创造的话，结合现有本地大模型和stable diffusion框架可以实现，如果是具体的目标检测等可以用Yolo等图像检测模型，训练识别具体的物品在用户描述的场景下在拐杖上集成摄像头，可以定期自动描述前面的环境，为一个多模态的模型，建议混合使用多个大模型这种应用需要模型具备强大的实时图像识别和场景理解能力，同时还要能够生成易于理解的文本描述。以下是一些建议的模型，它们在图像识别和自然语言生成方面表现良好： 1. MiniGPT-4 - 优点：MiniGPT-4 是一个强大的多模态模型，能够理解复杂的图像内容并生成详细的文字描述。它结合了先进的视觉编码器和强大的语言模型，非常适合用于图像识别和场景描述。 - 适用性：适合需要高度准确性和详细描述的应用场景，如帮助盲人感知周围环境。 - 资源消耗：相对较高，但考虑到其强大的功能，如果硬件条件允许，这是一个非常好的选择。 2. BLIP (Bootstrap Language-Image Pre-training) - 优点：BLIP 是一个由 Salesforce Research 开发的多模态预训练模型，它在图像描述生成任务上表现优秀。BLIP 可以生成自然、流畅的文本描述，适用于各种场景。 - 适用性：适合需要高质量图像描述的应用，尤其是在资源有限的情况下。 - 资源消耗：相比 MiniGPT-4 较低，但仍需要一定的计算资源。 3. ViLT (Vision-and-Language Transformer) - 优点：ViLT 是一个轻量级的多模态 Transformer 模型，能够在图像描述生成任务上取得良好的效果。它通过共享相同的 Transformer 架构来处理视觉和语言信息，具有较高的效率。 - 适用性：适合需要平衡性能和资源消耗的应用场景。 - 资源消耗：较低，适合嵌入式设备。 4. CLIP (Contrastive Language–Image Pre-training) - 优点：CLIP 是由 OpenAI 开发的一个多模态模型，它在图像分类、检索和生成描述方面表现出色。CLIP 可以通过对比学习方法来学习图像和文本之间的关系。 - 适用性：适合需要快速、准确的图像识别和描述的应用。 - 资源消耗：适中，可以在中等性能的设备上运行。 5. Google's VATT (Video and Text Transformer) - 优点：VATT 是一个多模态 Transformer 模型，可以处理视频和图像数据，生成高质量的文本描述。虽然主要用于视频，但在图像描述生成方面也有很好的表现。 - 适用性：适合需要处理动态环境的应用，如视频流中的场景描述。 - 资源消耗：较高，但功能强大。实际应用建议 - 硬件选择：考虑到您提到的应用场景，建议选择计算能力较强的嵌入式设备，如 NVIDIA Jetson 系列，以支持上述模型的实时运行。 - 模型部署：可以选择在云端进行推理，通过无线通信将图像上传到云端，然后将生成的描述返回到拐杖上的设备。这种方式可以减轻本地设备的计算负担，提高响应速度。 - 用户界面：确保生成的描述简洁明了，可以通过语音合成技术将文本转换为语音，方便盲人用户理解。希望这些建议对您有所帮助！如果您有更多具体的需求或问题，欢迎继续讨论。

浏览量0

万码BPKPWE8Y

pytorch 的torch 引用variable 报错

import torch from torch.autograd import Variable # torch 中 Variable 模块 tensor=torch.FloatTensor([[1,2],[3,4]]) print(tensor) "https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724998439442_dwaO.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724998439442_dwaO.png)

浏览量186

万码BPKPWE8Y

colab显示文件cannot be opened for training!

题目描述 colab用python训练模型报错？ ValueError: /content/driver/MyDrive/data/enwik9 cannot be opened for training! 题目来源及自己的思路 enwik9文件我保存在谷歌云盘的data文件夹下。为什么无法打开此文件用于训练呢？难道是代码里写的路径错误。那应该是怎么写呢？麻烦各位大佬看看是colab配置问题还是代码问题还是路径问题？相关代码代码如下： from google.colab import drive drive.mount('/content/drive') !pip install fasttext import fasttext model = fasttext.train_unsupervised('/content/driver/MyDrive/data/enwik9') colab分享链接如下： https://colab.research.google...

浏览量206

万码BPKPWE8Y

NER的BIO标签源码改写为BME代码

求指教：这里是github上中文NER源码(BIO标签)，想要改成BME标签（可以不用S），这段代码该怎么改呐？输出PER对应的字符 def get_PER_entity(tag_seq, char_seq): length = len(char_seq) PER = [] #构成一个zip对象,形状类似[( 1, ),( 1, ),( 2, ),( 2, )] #zip函数可以接受一系列的可迭代对象作为参数，将对象中对应的元素打包成一个个tuple(元组)， #在zip函数的括号里面加上*号，则是zip函数的逆操作 for i, (char, tag) in enumerate(zip(char_seq, tag_seq)): #tag里包含了O,B-PER,I-PER,B-LOCI-PER,B-ORG,I-PER if tag == 'B-PER': if 'per' in locals().keys(): PER.append('per') del per per = char if i+1 == length: PER.append(per) if tag == 'I-PER': per += char if i+1 == length: PER.append(per) if tag not in ['I-PER', 'B-PER']: if 'per' in locals().keys(): PER.append(per) del per continue return PER

浏览量210

万码BPKPWE8Y

到底哪家AI开放平台更好用，能力更全面？

现在很多时候要用到开放平台的API或SDK接入各种AI能力，但很多时候不好找，有时候某平台上有适合的SDK，却只支持一种语言，有些调用后效果又不太理想。每次都挺麻烦的，不少时间都花在这上面，各位大神有什么办法能提高效率呢

浏览量277

万码BPKPWE8Y

安装了python的chatterbot库后，调用import chatterbot,出现报错

"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997528396_ujw6.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997528396_ujw6.png)

浏览量223

万码BPKPWE8Y

gensim中tfidfModel和LDAModel怎样进行增量训练？

使用gensim库时，已经训练有tfidfmodel和ldamodel模型，怎样在已经训练好模型基础上进行增量训练

浏览量252

万码BPKPWE8Y

各位能帮忙看看我这个python程序哪里出问题了吗?

"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997310674_EkAf.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997310674_EkAf.png) "https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997326670_icv0.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997326670_icv0.png)

浏览量280

万码BPKPWE8Y

知识图谱构建技术推荐：实体对齐，知识推理等？

知识图谱构建技术推荐：实体对齐，知识推理等

浏览量259

万码BPKPWE8Y

python怎样批量读取CAD文件右下角的文字信息，如图号，工程名之类？

python怎样批量读取CAD文件右下角的文字信息，如图号，工程名之类？或者其他语言支持吗？

浏览量222

万码BPKPWE8Y

如何看待使用 chatGPT 回答这一行为？

这两天看到不少人使用 ai 的回复作为本站的回复。这些回答无一例外都被打了负分，想问问打负分的各位是觉得经过用户上传的 chatGPT 回复不符合哪一条了？ "https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996899695_aPBW.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996899695_aPBW.png) 还是说，就是接受不了 AI 作答呢？我寻思着这些个回答也没有回答错误、狗屁不通，或者说不尊重任何人了吧。这些个行为和科幻作品里面抵制 cyborg 的人类沙文主义、原教旨主义者不是一样一样的？那你回家不得先把扫地机器人扔了？

浏览量196

万码BPKPWE8Y

多模态情感识别如何处理数据？

我现在需要做上传视频进行多模态情感识别的系统。我已经使用MELD开源库的代码训练出了模型，它可以正常测试MELD里的.p数据。但是我不知道怎么将原始视频转换为类似于MELD里.p文件的数据以输入模型

浏览量182

万码BPKPWE8Y

有没有强化学习落地案例分析和实现方法详细介绍？

有没有强化学习落地案例分析和实现方法详细介绍

浏览量211

万码BPKPWE8Y

今天最早一批申请的openai账号到期了，赠送的18美金你都花完了吗？

送你的18美金，你好好使用了吗？

浏览量203

万码BPKPWE8Y

segmentfault会如何对待chatgpt?

活在 ChatGPT 们阴影里的 Stack Overflow：流量萎缩、裁员 10%，CEO 坦言公司正处于困难时期期待你的高见

浏览量250

万码BPKPWE8Y

自然语言处理在实践中的问题？

各位答主我在这里向您问好我现在手头有个任务，根据n多个包含不同级别汉字的数据集，去统计输入的去重后的大篇幅文本中有哪些属于对应级别数据集，而且返回给前端完整的文章，文章中标记错误的标点符合、字词、语病、逻辑错误。我起初尝试训练gpt来做到这件事但是似乎不太行，有什么合适的模型可以做到这件事吗？我在这里先行拜谢了

浏览量286

万码BPKPWE8Y

HuggingChat 可以私有化部署吗？

我看到关于 HuggingChat 的介绍，所示开源的：https://zhuanlan.zhihu.com/p/625198141 "https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996122005_tyhK.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996122005_tyhK.png) 我可以从哪里找到可以直接部署的代码呢？

浏览量270

万码BPKPWE8Y

推荐一篇自然语言编程的文章，大家讨论一下？

用自然语言让AI打leetcode周赛大家都有什么看法？是码农的福音还是丧钟？

浏览量275

万码BPKPWE8Y

从大量评论中提取高频长词汇的分词工具？

目前有100w条各种评论信息，如何从这堆信息中提取出高频词汇目前使用百度、阿里等NLP分词效果不太理想，大部分分出来都是2个单词，市面上有没有那种长词汇分词的工具，或者如何实现4个或者5个词分词效果

浏览量266

万码BPKPWE8Y

如何分段处理超过ChatGPT最大token长度的问题？

如何把超过 chatgpt 最大 token 长度的内容分段告诉 chatgpt，并能让 chatgpt 知道我要提供的内容已经发送完毕

浏览量286

万码BPKPWE8Y

有没有好用的AI编程助手IDEA 插件推荐？

请问你们都是用什么 AI 工具来辅助编程，有没有高手推荐一个好用的用了一些 bito，CodeGeex等

浏览量415

万码BPKPWE8Y

有哪些方案可以实现员工疑问智能回复的机器人系统？

最近公司领导提了个需求：因为公司规章制度繁多，希望有一个智能对话机器人，能解答员工的各种疑问。举个例子：比如有销售人员不知道报销流程怎么走，只需要跟机器人对话，例如员工输入：报销流程智能机器人就能回答关于报销流程的规章制度。这样的需求该怎么实现呢？有没有好的方案？

浏览量248

万码BPKPWE8Y

一款RAG问答产品，如何搭建一个差异化的私域知识库？

有哪些快速的渠道或者方式可以搭建起来一个知识库。

浏览量246

履历

天津大学

硕士

2005.09-2009.06