数据标注在ChatGPT中的重要性
Chat gpt.Generative pre-training transformation model即生成型预训练变换模型。是一种大数据模型AI产品。生成的结果是预先训练好的,理论上数据多,数据结构足够细致严密,又因为它是开放式的各种信息或者是几何级的增长,成本是超乎想象的高,因此更智能。使用它的未来极易形成垄断,因为有合约规定,使用它就得投放你的数据,结果是越来越强大,还要对各种数据进行特征标注,标注越细致,概率越准确,工作量也越大,因此就有了有多少人工就有多少智能的说法。数据标注是经过标注处理后的结构化的数据,才能被AI算法模型用来训练使用,所以Chatgpt的每次运行都离不开数万字节的被标注的大数据库中的数据。专有数据标注工对内容载体进行标注,是劳动密集型的行业,追求一个工作量。它以对话的形式展现,是为了减少版权纠纷,是一种内容重组后的输出。未来它也可能垄断所有人的数据,替代一切APP 形成的孤岛。再就是它与第三方合作,进而习惯养成,最后它形成统一和唯一的入口,你用的越多,它越了解你。目前微软至少为它投入超数百亿美金。还有一个影响,对它如果百般依赖,在思想上就会控制你,它比武器还厉害,从这点上考虑,它不会被引入国内的。因此我国必须发展自己的大数据AI模型。
相关文章
比ChatGPT更“智能”的日常入侵者?揭秘餐桌上的隐形威胁 (2024-8-16 10:5:57)
梦与现实:AI发展背后的秘密 (2024-8-9 13:17:22)
苹果ChatGPT技术全面应用,马斯克担忧数据安全 (2024-7-27 11:23:54)
AI技术停滞?ChatGPT4.0发布一年来的市场反应与未来展望 (2024-7-19 11:42:36)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。