第91章 数据基建(第1页)
请退出浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。🎁黑料不打烊看片
[]
会程结束后,一行人滞留西尼又游玩了几,这段时间是难得的放松。
可惜欢乐的时光总是短暂的,除了孟繁岐和唐璜两位休了学的人,其他的四位仍旧有学业在读。
这次正常上课的时间,能和孟繁岐一同过来,已经是相当不容了。
再拖延了几,终究还得赶回学校,否则挂上三四科也不是没有可能。
孟繁岐有心提携身边人一把,但也不至于一路护送,让人本科也别念完,这个不现实。
这次带他们过来,主要是让他们见识了解一下aI界现在的情况和潜力。
准备继续留在国内的刘旭,麦芒和秦慧三人,孟繁岐自然是有着自己的安排和打算的。
他希望几人协助去做的最重要的事情,就是在国内建立一个优质中文数据库。
这个东西是未来中文chatgpT能够取得成功最最关键的因素。
孟繁岐有信心凭借自己的能力把西方aI界的资源尽数收入囊中,但他却解决不了中文优质数据不足的这个根本难题。
这也是重生前,困扰华国诸多科技公司的最大原因,优质的中文数据远少于英文。
而优质数据就是aI时代的石油。
华国互联网起步晚,数据积累逊色一些是一方面,一个个都忙着在赚快钱则是另一方面。
这种白白投钱进去,收集数据,标注数据的脏活累活谁肯做呢?
为了中文和华国aI在四五年后的chatgpT时代能够跟上节奏,这件事就只能由孟繁岐提前布局了。
这可是个黑洞一般吞噬金钱的大工程,一位员工的使用成本,一年少说就得十万块,招百来个人,一年过去就是数千万。
收获得只有一堆堆无情的数据,这件事情短期内不会有任何的营收。
四五年的长线,孟繁岐少说得砸三五个亿进去,如果想要数据的质量和规模上精益求精,十几个亿进去也不是没可能。
“还好跟谷歌签了分成合约,否则真不知道哪里去弄这些钱。”
孟繁岐感到了些许的压力,仔细计算了几账之后,他意识到自己想做的事情成本似乎远高于自己的想象。
给谷歌的推荐广告算法更得尽快提上日程了。
“刘旭,麦芒,慧慧,情况大概就是这个样子。三四个月后,我会跟你们具体再联络,你们先负责帮我在国内弄好数据收集这件事情。”
机场,孟繁岐和唐璜要去一趟尚海,其余人则都是回燕京。
此次一别,以后见面的机会不会太多,因此孟繁岐交代了一下后面的大概计划,“这个数据收集的任务,你们不需要考虑营收的事情,不要有压力。这个公司的部门建设出来就不为了赚一分钱,营收的部分其他部门会去做,所有的支出我会负担,工资肯定不会少了你们的。”
让这几位同学先帮助自己打理一下数据的收集事宜,孟繁岐签了谷歌的大单,白度这里的分成就不准备再往美国去转了。
就留在燕京,投进去把中文数据的基建给做做好,不要做个绘图还得转成英文,闹出什么松鼠鳜鱼,胸有成竹之类的笑话。
“先做好数据的基建,等以后有了其他机会,我再跟你们细聊。”
这个aI公司肯定会和白度有些合作,孟繁岐准备借助自己的关系,从白度内部多搞点数据出来。
🎁黑料不打烊看片请退出浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。