最全AI语料概念股整理

AIGC
后台-插件-广告管理-内容页头部广告(手机)

一,谷歌聊天机器人遭监督机构罚款,AI语料价值显现

3月20日,法国竞争监督机构对谷歌公司罚款2.5亿欧元,原因是谷歌在与媒体出版商的关系中违反了欧盟知识产权规则。监管机构称,谷歌的聊天机器人Bard(现名Gemini)在未通知的情况下使用出版商和新闻机构的内容进行了训练。

大模型的工作原理是先通过在大规模语料库上进行预训练,学语言的统计规律,再通过优化和调整,不断提高预期结果输出的准确性。我国已于2023年8月起施行《生成式人工智能服务管理暂行办法》,规定了训练数据需要合法来源的数据和基础模型,不得侵犯他人知识产权。

该事件间接推动数据版权在生成式AI模型发展的并形成经营模式。

 

二,训练语料价值或迎重估

近年来,人工智能(AI)技术的快速发展已经深刻地改变了我们的生活和工作方式。而在这一过程中,大量的数据成为了AI技术发展的重要基础。“语料库”指的是用于训练人工智能的文本库或数据集合,使其变得智能的材料。

如果没有语料库来训练AI,AI就无法学习。你的语料库越大,人工智能就会变得越熟练、越聪明。但当涉及版权和知识产权法时,人工智能语料库可能非常漏洞百出。

在当今这个信息爆炸的时代,AI(人工智能)技术的快速发展不仅在诸多产业领域引发了革命,它更是成为了改变游戏规则的关键力量。传统的分析依赖于专业人员的知识和经验,而现在,AI和大数据技术的结合,尤其是强大的AI语料库的应用,正在为投资决策引入新的维度和视角。

 

三,AI语料概念股整理

1,文本语料:

用于训练热门人工智能模型的数据集“显著"更多地依赖于出版商内容,与通用网络内容相比,其比重范围从5倍多到近100倍。未来AI相关公司使用出版集团内容进行大模型训练并提供资金补偿将形成趋势。生成式AI时代教育出版公司或迎来价值重估。数据价值重估已是确定性的产业趋势。AI模型改进依赖于强大的计算能力和大量可用数据。

1)中原传媒:

国内目前唯一确定能间接获取openai版权费的公司。拥有稀缺性数据资源的出版公司具备稀缺性,中原传媒有望在版权专项收费板块实现爆发式增量。OpenAI曾表示训练ChatGPT使用了45TB的数据、近1万亿个单词;教育出版公司具有的优质正版文字语料资源,而高质量数据集为大模型开发的刚需,OpenAI和Axel Springer的合作也验证了供求关系变化下出版公司的数据资源有望价值重估.

2) 果麦文化:过程语料+高精度AI校对构筑核心护城河

1、公司股价已经调整到位,一度接近董事长增持价44.5元,处于明显底部!
2、AI校对进展顺利,在7月初的世界人工智能大会,果麦与星图比特联合展示的校对产品相较此前已有大幅提升,7.9日宣布增资及签署协议标志着果麦AI校对驶入快车道。后续产品落地及下游订单有望加速.
3、公司拥有稀缺的过程稿语料,追求万分之一的校对精度。且公司的校对产品正在叠加内容审核、敏感词等功能模块,未来将延伸至新闻媒体、政府公文及C端用户。预计未来每年为公司贡献15亿收入,7-10亿净利润.


3) 中国科传,兼具三大亮点:数据要素、AI语料库、在线教育。
1,公司积极布局知识付费市场,建立专业学科数据库(科学文库)、数字教育云服务(中科云教育平台)以及医疗健康大数据(中科医库)。
2,公司拥有非开源内容及数据库壁垒,其旗下拥有的大量数字化期刊文献资源具有较高权威性,有可能成为生成式AI潜在语料库。
3,积极开拓在线教育业务,其“中科云教育平台”为广大高等院校师生提供在线教学、在线考试、在线观看视频等服务

4)中文在线

公司深耕文化数字产业20余年,公司以内容为基石,积累了海量正版数字内容资源,目前已经积累了超过550万种数字内容资源,拥有超过450万名网络原创驻站作者。这些数字内容资源不仅包括了各类文学作品,还包括了大量的音频、漫画等多媒体内容。此外,中文在线还与600多家版权机构合作,签约了超过2000名知名作家和畅销书作者。

这些数字内容资源对于AI技术的应用来说具有重要的意义。首先,它们可以成为AI模型训练的素材,帮助AI模型更好地理解和处理人类语言。其次,这些数字内容资源还可以被用于各种AI应用场景,例如自然语言处理、机器翻译、语音识别等等。
除此之外,中文在线还在积极探索AI技术在文学领域的应用。例如,公司已经推出了AI生成的漫画、动态漫等作品,并且已经开始将其应用于短剧剧本创作等方面。

2,视频语料

1)华策影视:国内影视制作龙头企业;

2)中广天择:全媒体优质视频内容提供商,万兴科技正式宣布与长沙广电国有控股上市公司中广天择达成战略合作;

3, 图片语料

视觉中国:公司拥有数以亿计的专业级且获版权许可的优质图片、视频音乐素材,是市场上少有的高质量素材的图像库之一;

4,金融语料

同花顺:中国金融信息服务业第一家上市公司,移动互联网证券第三方平台龙头,股票 APP月活量超东方财富和大智慧之和,业内最完整的互联网金融产品公司之一;

5,大宗商品语料

1)上海钢联:大宗商品及相关产业数据服务商,作为独立的第三方机构,提供以价格为核心的围绕价格波动的多维度数据。为全球客户提供产业数据服务;

2)卓创资讯:国内领先的大宗商品信息服务企业,是专注于大宗商品市场数据监测、交易价格评估及行业数据分析、行业深度研究的专业服务提供商;

6,消费语料

值得买:集导购、媒体、工具、社区属性为一体的消费领域门户型网站服务平台;

汇纳科技:公司积累的实体商业数字底座包含大量线下商业客流等大数据资源,可为AIGC(利用人工智能生成内容)领域的各类模型训练提供高质量数据资源。

7,航运语料

中远海科:船视宝系列产品已汇聚全球约24万艘商船290亿条船位数据,覆盖全球5000余个港口、4万多个泊位,识别动态数据6000多万条,开放API接口650个左右,累计调用近4亿次;

8,医学语料

贝瑞基因:CNVisi利用人工智能深度学习算法,挖掘20+权威公共数据库、百万自有CNV大数据以及20多万份CNV-seq临床实践报告;

我会在 公众号:海涵财经 每天更新最新的华为概念、创新减肥药、数字经济、ChatGPT、AI算力、CPO/硅光芯片、大数据、6G卫星、数据要素、医疗新基建、一体化压铸、 汽车智能化,激光雷达,HUD,车规芯片,空气悬挂、L3级智能驾驶、PET铜箔,纳电池,800V高压,光伏HJT、TOPCON、钙钛矿、光伏XBC、BIPV、IGBT芯片、碳化硅SIC、CTP/CTC/CTB电池、4680电池、工业母机、海风柔直高压、新能源车高压快充、高镍三元、碳纤维、PET铝箔、PET铜箔、空气源热泵、新材料、中药创新药、中药配方颗粒、乡村振兴、锂矿、钒液流电池、钠离子电池、分布式储能、集中式储能、抗原检测等最新题材热点挖掘,未来属于高预期差的结构性市场,把握核心赛道以及个股的内在价值逻辑预期差才是根本所在。

— END —

先赞后看,养成习惯

免责声明:图片、数据来源于网络,转载仅用做交流学习,如有版权问题请联系作者删除

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。