万码BPKPWE8Y
双非电子信息硕士女是不是只能家里蹲啊?
目前今年的环境是这样的,学校学习的东西和实际工作有所出入是正常的,先试试比较流行的大模型和AI比较好的赛道各种初创公司比较多,目前很多外企也开放有很多外包的岗位,可以多尝试一下,有机会转正,今年的优先级一定是苟住,然后多储备自己的能力,多尝试吧
万码BPKPWE8Y
AI方向,学习c还是python,求大神指点?
首先业务层面的AI方向,优先学习python,入门快,框架多,tensorflow和pytorch等可以快速完成模型的学习和训练等任务
易学性:Python语法简洁明了,对于初学者来说非常友好,可以让你更快地入门编程。
社区支持:Python拥有庞大的开发者社区和丰富的资源,包括大量的教程、文档和开源项目。
库和框架:Python在AI领域有着无可比拟的优势,有许多强大的库和框架支持,如TensorFlow、PyTorch、Keras等,这些工具大大简化了机器学习和深度学习模型的构建过程。
应用广泛:Python不仅用于AI,还广泛应用于Web开发、数据科学、自动化脚本等多个领域,这使得Python成为一门非常实用的语言
但是对于真实的工业场景下,比如检测任务,以及工业故障等,c++基本已经是唯一的方案,优先需要考虑到效率和性能上的表现
同时对于科技企业来说,尤其是大厂,比如英伟达等企业,需要更多底层优化的建设,各有优缺点
性能:C语言执行效率高,适合对性能有极高要求的应用场景。如果你需要处理大量数据或实时计算,C可能是一个更好的选择。
底层控制:C语言提供了更直接的内存管理和硬件交互能力,这对于某些特定的AI应用(比如嵌入式系统中的AI)非常重要。
学习曲线:与Python相比,C的学习曲线更为陡峭,需要更多的时间来掌握其语法和最佳实践。
库支持:虽然也有不少优秀的AI库支持C/C++(例如Dlib、OpenCV等),但相较于Python,它们的数量太少了
万码BPKPWE8Y
AI识图的功能推荐用哪个模型
如果仅仅为对AI的文本做提取,可以推荐使用千问2VL模型,提取对应的文本信息
如果需要识别图片的内容,并且对内容进行理解和创造的话,结合现有本地大模型和stable diffusion框架可以实现,
如果是具体的目标检测等可以用Yolo等图像检测模型,训练识别具体的物品
在用户描述的场景下在拐杖上集成摄像头,可以定期自动描述前面的环境,为一个多模态的模型,建议混合使用多个大模型
这种应用需要模型具备强大的实时图像识别和场景理解能力,同时还要能够生成易于理解的文本描述。以下是一些建议的模型,它们在图像识别和自然语言生成方面表现良好:
1. MiniGPT-4
- 优点:MiniGPT-4 是一个强大的多模态模型,能够理解复杂的图像内容并生成详细的文字描述。它结合了先进的视觉编码器和强大的语言模型,非常适合用于图像识别和场景描述。
- 适用性:适合需要高度准确性和详细描述的应用场景,如帮助盲人感知周围环境。
- 资源消耗:相对较高,但考虑到其强大的功能,如果硬件条件允许,这是一个非常好的选择。
2. BLIP (Bootstrap Language-Image Pre-training)
- 优点:BLIP 是一个由 Salesforce Research 开发的多模态预训练模型,它在图像描述生成任务上表现优秀。BLIP 可以生成自然、流畅的文本描述,适用于各种场景。
- 适用性:适合需要高质量图像描述的应用,尤其是在资源有限的情况下。
- 资源消耗:相比 MiniGPT-4 较低,但仍需要一定的计算资源。
3. ViLT (Vision-and-Language Transformer)
- 优点:ViLT 是一个轻量级的多模态 Transformer 模型,能够在图像描述生成任务上取得良好的效果。它通过共享相同的 Transformer 架构来处理视觉和语言信息,具有较高的效率。
- 适用性:适合需要平衡性能和资源消耗的应用场景。
- 资源消耗:较低,适合嵌入式设备。
4. CLIP (Contrastive Language–Image Pre-training)
- 优点:CLIP 是由 OpenAI 开发的一个多模态模型,它在图像分类、检索和生成描述方面表现出色。CLIP 可以通过对比学习方法来学习图像和文本之间的关系。
- 适用性:适合需要快速、准确的图像识别和描述的应用。
- 资源消耗:适中,可以在中等性能的设备上运行。
5. Google's VATT (Video and Text Transformer)
- 优点:VATT 是一个多模态 Transformer 模型,可以处理视频和图像数据,生成高质量的文本描述。虽然主要用于视频,但在图像描述生成方面也有很好的表现。
- 适用性:适合需要处理动态环境的应用,如视频流中的场景描述。
- 资源消耗:较高,但功能强大。
实际应用建议
- 硬件选择:考虑到您提到的应用场景,建议选择计算能力较强的嵌入式设备,如 NVIDIA Jetson 系列,以支持上述模型的实时运行。
- 模型部署:可以选择在云端进行推理,通过无线通信将图像上传到云端,然后将生成的描述返回到拐杖上的设备。这种方式可以减轻本地设备的计算负担,提高响应速度。
- 用户界面:确保生成的描述简洁明了,可以通过语音合成技术将文本转换为语音,方便盲人用户理解。
希望这些建议对您有所帮助!如果您有更多具体的需求或问题,欢迎继续讨论。
万码BPKPWE8Y
pytorch 的torch 引用variable 报错
import torch
from torch.autograd import Variable # torch 中 Variable 模块
tensor=torch.FloatTensor([[1,2],[3,4]])
print(tensor)
"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724998439442_dwaO.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724998439442_dwaO.png)
万码BPKPWE8Y
colab显示文件cannot be opened for training!
题目描述
colab用python训练模型报错? ValueError: /content/driver/MyDrive/data/enwik9 cannot be opened for training!
题目来源及自己的思路
enwik9文件我保存在谷歌云盘的data文件夹下。为什么无法打开此文件用于训练呢?难道是代码里写的路径错误。那应该是怎么写呢?麻烦各位大佬看看是colab配置问题还是代码问题还是路径问题?
相关代码
代码如下:
from google.colab import drive
drive.mount('/content/drive')
!pip install fasttext
import fasttext
model = fasttext.train_unsupervised('/content/driver/MyDrive/data/enwik9')
colab分享链接如下:
https://colab.research.google...
万码BPKPWE8Y
NER的BIO标签源码改写为BME代码
求指教:
这里是github上中文NER源码(BIO标签),想要改成BME标签(可以不用S),这段代码该怎么改呐?
输出PER对应的字符
def get_PER_entity(tag_seq, char_seq):
length = len(char_seq)
PER = []
#构成一个zip对象,形状类似[( 1, ),( 1, ),( 2, ),( 2, )]
#zip函数可以接受一系列的可迭代对象作为参数,将对象中对应的元素打包成一个个tuple(元组),
#在zip函数的括号里面加上*号,则是zip函数的逆操作
for i, (char, tag) in enumerate(zip(char_seq, tag_seq)):
#tag里包含了O,B-PER,I-PER,B-LOCI-PER,B-ORG,I-PER
if tag == 'B-PER':
if 'per' in locals().keys():
PER.append('per')
del per
per = char
if i+1 == length:
PER.append(per)
if tag == 'I-PER':
per += char
if i+1 == length:
PER.append(per)
if tag not in ['I-PER', 'B-PER']:
if 'per' in locals().keys():
PER.append(per)
del per
continue
return PER
万码BPKPWE8Y
到底哪家AI开放平台更好用,能力更全面?
现在很多时候要用到开放平台的API或SDK接入各种AI能力,但很多时候不好找,有时候某平台上有适合的SDK,却只支持一种语言,有些调用后效果又不太理想。每次都挺麻烦的,不少时间都花在这上面,各位大神有什么办法能提高效率呢
万码BPKPWE8Y
安装了python的chatterbot库后,调用import chatterbot,出现报错
"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997528396_ujw6.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997528396_ujw6.png)
万码BPKPWE8Y
gensim中tfidfModel和LDAModel怎样进行增量训练?
使用gensim库时,已经训练有tfidfmodel和ldamodel模型,怎样在已经训练好模型基础上进行增量训练
万码BPKPWE8Y
各位能帮忙看看我这个python程序哪里出问题了吗?
"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997310674_EkAf.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997310674_EkAf.png)
"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997326670_icv0.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724997326670_icv0.png)
万码BPKPWE8Y
知识图谱构建技术推荐:实体对齐,知识推理等?
知识图谱构建技术推荐:实体对齐,知识推理等
万码BPKPWE8Y
python怎样批量读取CAD文件右下角的文字信息,如图号,工程名之类?
python怎样批量读取CAD文件右下角的文字信息,如图号,工程名之类?或者其他语言支持吗?
万码BPKPWE8Y
如何看待使用 chatGPT 回答这一行为?
这两天看到不少人使用 ai 的回复作为本站的回复。
这些回答无一例外都被打了负分,想问问打负分的各位
是觉得经过用户上传的 chatGPT 回复不符合哪一条了?
"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996899695_aPBW.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996899695_aPBW.png)
还是说,就是接受不了 AI 作答呢?我寻思着这些个回答也没有回答错误、狗屁不通,或者说不尊重任何人了吧。
这些个行为和科幻作品里面抵制 cyborg 的人类沙文主义、原教旨主义者不是一样一样的?
那你回家不得先把扫地机器人扔了?
万码BPKPWE8Y
多模态情感识别如何处理数据?
我现在需要做上传视频进行多模态情感识别的系统。我已经使用MELD开源库的代码训练出了模型,它可以正常测试MELD里的.p数据。
但是我不知道怎么将原始视频转换为类似于MELD里.p文件的数据以输入模型
万码BPKPWE8Y
有没有强化学习落地案例分析和实现方法详细介绍?
有没有强化学习落地案例分析和实现方法详细介绍
万码BPKPWE8Y
今天最早一批申请的openai账号到期了,赠送的18美金你都花完了吗?
送你的18美金,你好好使用了吗?
万码BPKPWE8Y
segmentfault会如何对待chatgpt?
活在 ChatGPT 们阴影里的 Stack Overflow:流量萎缩、裁员 10%,CEO 坦言公司正处于困难时期
期待你的高见
万码BPKPWE8Y
自然语言处理在实践中的问题?
各位答主我在这里向您问好
我现在手头有个任务,根据n多个包含不同级别汉字的数据集,去统计输入的去重后的大篇幅文本中有哪些属于对应级别数据集,而且返回给前端完整的文章,文章中标记错误的标点符合、字词、语病、逻辑错误。
我起初尝试训练gpt来做到这件事但是似乎不太行,有什么合适的模型可以做到这件事吗?我在这里先行拜谢了
万码BPKPWE8Y
HuggingChat 可以私有化部署吗?
我看到关于 HuggingChat 的介绍,所示开源的:https://zhuanlan.zhihu.com/p/625198141
"https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996122005_tyhK.png" (https://wmprod.oss-cn-shanghai.aliyuncs.com/community/1724996122005_tyhK.png)
我可以从哪里找到可以直接部署的代码呢?
万码BPKPWE8Y
推荐一篇自然语言编程的文章,大家讨论一下?
用自然语言让AI打leetcode周赛
大家都有什么看法?是码农的福音还是丧钟?
万码BPKPWE8Y
从大量评论中提取高频长词汇的分词工具?
目前有100w条各种评论信息,如何从这堆信息中提取出高频词汇
目前使用百度、阿里等NLP分词效果不太理想,大部分分出来都是2个单词,市面上有没有那种长词汇分词的工具,或者如何实现4个或者5个词分词效果
万码BPKPWE8Y
如何分段处理超过ChatGPT最大token长度的问题?
如何把超过 chatgpt 最大 token 长度的内容分段告诉 chatgpt,并能让 chatgpt 知道我要提供的内容已经发送完毕
万码BPKPWE8Y
有没有好用的AI编程助手IDEA 插件推荐?
请问你们都是用什么 AI 工具来辅助编程,有没有高手推荐一个好用的
用了一些 bito,CodeGeex等
万码BPKPWE8Y
有哪些方案可以实现员工疑问智能回复的机器人系统?
最近公司领导提了个需求:因为公司规章制度繁多,希望有一个智能对话机器人,能解答员工的各种疑问。
举个例子:比如有销售人员不知道报销流程怎么走,只需要跟机器人对话,例如员工输入:报销流程 智能机器人就能回答关于报销流程的规章制度。
这样的需求该怎么实现呢?有没有好的方案?
万码BPKPWE8Y
一款RAG问答产品,如何搭建一个差异化的私域知识库?
有哪些快速的渠道或者方式可以搭建起来一个知识库。