一横,一竖,一轻点。
一撇,一捺,一弯钩。
清风徐来,一缕晴光落在她笔尖,画面美得不可思议。
弹幕有一瞬间集体恍惚,像是连呼吸都忘记。
好半晌众人才从这仿若古装大片的唯美场景中清醒过来,顿时:“……?!”
这这这是我们现在应该看到的事吗?
别人在写代码,你在写书法???
***
整整一个上午,所有人目瞪口呆地看着杜诗怡半点没去往下推进代码进度,时间全部花在誊写上,她长发半挽,玫瑰色的唇片轻轻弯着,连周身的空气都被衬得清清净净,像是要化在这样好的天光云影里一般。那眉眼间的神态极为放松,一笔一画却落得极认真,在纸上连绵成一片温柔的墨色。
“晋太元中,武陵人捕鱼为业……”
“山峦为晴雪所洗,娟然如拭……”
“至若春和景明,波澜不惊……”
开始的时候每写一个字就要去翻一下隶书字典,后面明显流畅起来,落笔的动作极为写意,一己之力带跑了全屋的工科气氛。
【今天依旧是跟不上大佬思路的一天[捂脸][捂脸]为什么忽然去写古文了呀~不过跟景园的气韵真是好配诶,我真是恍惚一种人在画中游的感觉~】
【害,反正诗诗总有道理在,我早就放弃去揣测她的境界了,还不如多吸两眼神颜2333】
【而且她这字……吸气,好好看啊我天】
镜头拉近,定格在少女手下的素笺,那一手字极为端丽,温文舒朗又灵动飘逸,隐然有清正之风。
有懂行的已经认出来了。
【哇嗷——汉隶流丽体!】
【天呐!诗诗到底还有多少惊喜是我们不知道的!】
同一时间,郑飞扬也在好奇地看着。
他反正程序还没跑完,这会儿闲着没事,兴致勃勃凑过来:“怡宝,这又是干嘛呢!”
杜诗怡握着笔,有点无奈地笑了一下:“写字啊,等会儿扫描去。训练模型缺语料,只能自己造了嘛。”
“语料?”郑飞扬摸摸下巴,到底是十年默契,反应极快,“你是想要电子版的隶书?”
杜诗怡点头:“嗯呢。”
“我查过金汀帛书,专家初步的判定是全篇笔迹风格近似,极大可能为一人所写,且是标准的汉隶流丽体,上次这种字体被发现还是在十七年前。你也知道,现如今咱们的绝大多数文物都没上电子化手段,网上能搜到的图片精度不够,完全用不了,可现在既然要做数字缀合,没有足够的语料搞不定呀。”
这事郑飞扬当然明白,机器学习都是这个原理,他自己的边缘轮廓提取模型也是用了无数打散的拼图块做训练材料,才让计算机学会如何自动拼接的。只是……
“你模型这么奢侈?训练材料居然必须要成品隶书?这是什么高深路数——”
这话没说完,突的一断,须臾猛地瞪大眼。
“我靠!不会吧?!”
杜诗怡弯起眼睛。
她当然也没打算瞒着,只是点点头,想了想又叮嘱了一句:
“我本来只是想着,单个维度的性能总有上限,多一重保障多一份安心,后来发现这好像是一个避不开的事情,这个课题想全通,只能走这条路。41652号-42980号很特殊,你们缀合的时候注意一点。”
少女声线清朗,没刻意压低,个人战不存在厚此薄彼,本来就是说给所有伙伴的提示,何况就是没有这一句,那几个男生应该很快也会发现异常。
直播间众人都有些摸不着头脑,但郑飞扬目光一凛,迅速应了声退回去。他无条件相信怡宝的每个判断,立时就去看那个庞大的碎片压缩包。
俞诚同样眉心一动,但他的程序毕竟比郑飞扬运行得早,恰在这一刻已经结束任务自动终止。他凝眸,鼠标点击去查看运行报告,就见除了众多已然成型、三三两两散落在画布间的拼接图之外,还有一行长长的英文醒目地悬在屏幕中央——
——程序报错!
他和弹幕同时一惊:“怎么回事!”
这是几乎能够匹敌丁浩轩的代码,一直以来气势强劲从未遇到阻碍,已经拼出的那么多器物名称更是证明了它的算法根基不存在问题,怎么会在运行阶段就提示出错!
俞诚在机器学习和云计算上也经历过不少大场面,乍遇突发意外没乱了阵脚,立刻调出先前全像素识别的基础数据来。结果一看之下更是惊滞,几乎不敢置信眼前的一切。
[41652号]:6.71,1.26,8.95,7.03……
[41653号]:6.71,1.26,8.95,7.03……
[41654号]:6.71,1.26,8.95,7.03……
……
弹幕悚然一惊。
他们看不懂那些数字具体代表的含义,但是——
【一模一样!!!怎么会各项数据全都一样!!!】
谁都知道边缘轮廓提取靠的是分析各个碎片独特的形状脉络,从中挑出最契合的两块进行连接,可眼下这些碎片所有维度的基础数据竟然没有分毫差别,还怎么区分哪一块是哪一块!
所有人几乎是全然惊呆。
而在俞诚对面,杜诗怡无声地叹一口气。
所以说,这就是她之前看到OpenCv返回结果时,内心如出一辙的震动。
与郑飞扬不同,她昨夜去处理支线前就已经完成边缘轮廓提取的所有工序,只是没有命令程序去真正运行拼接。本来按照她的打算,就是做完三个维度之后再一并去缀合拼接,只要地基打好了,最后那一步并不急。
但多年来无数重大项目历练出的谨慎,让她额外多写了一个检查脚本,出门前按下Run键让电脑自动执行。
她要计算机给她对比所有碎片的基础数据情况。
以防出现不可预料的万一。
其实程序性能早就经过无数次交叉验证,和俞诚他们训练模型的方法一样,她从网上下载了几万张风景图片,写代码把它们随机切割成无数碎块,再用先前做好的融合算子让计算机去学习自动缀合。过程很顺利,随着时间慢慢流逝,那些海量的照片被一一复原,她从没发现过有什么不妥。
多做一步,也就只是图个最后的心安罢了。
然而在今天早上。
她真的看到了这个万一。
一千多行一模一样的数据,被她的检查程序重重地圈出来提醒,一片鲜红,触目惊心。
世上没有两片一模一样的树叶,可是竟然,有一千多块一模一样的碎帛!
压缩包里的高清图片上,它们的断口整整齐齐,像是被什么人用刀裁过。
千年前发生了什么早已不得而知,可是如今,这些诡异的、不合常理偏偏又真切存在的碎帛,就是本轮课题最大的阻碍!
它直指边缘轮廓提取方案的立足核心!
要么放弃全通,将这部分无法处理的碎片排除在外,单去做其他残块的拼接,也能有不错的成绩。
要么另辟蹊径,迎着这昭然若示的艰难险阻,去开创从未可及的全新未来!
直播间数百万人都被这突然爆起的惊涛骇浪前所未有地震荡冲击,而俞诚仍在发怔。
本就是完全没有先人经验能去参考的课题,强行顶着巨大的开荒压力一路走到今天,走到这里,似乎已经山穷水尽。
当这个领域最有前景最具权威的理论方案也鞭长莫及。
还能有蹊径吗?
他长久无声,目光怔怔地落在杜诗怡今天写了一上午的隶书手迹上。
良久,突然一个激灵,如同方才的郑飞扬一样,猛地瞪大眼睛。
当颜色近似、轮廓相同,一切判别手段都失效的时候。
人脑还有最后的一招。
那就是——
“字形!”
俞诚猛地倒吸一口冷气,震惊失声:“小诗!你要上最高难度,去做从没有人实现过的字形提取?!”
当一切外力都无用、必须回到碎裂的文字本身。
我们的大脑会按照字形,按照我们出生至今吸收的所有知识,去判断出最优的连接可能。
我们会把断裂的“尹”和“口”上下拼接,凑成一个君字。
也会把离散的“朱”与“雀”左右缀连,合成一个名词。
可这样的思考能力、这样的复杂过程,要训练计算机完全掌握,需要何等的技术水平?!
那一瞬间,就连屏幕前各大高校的著名教授也在震惊抽气,完全不敢相信自己听到了什么。即使是他们,都无法保证自己一定有这样的能力与胆魄,在这样的年纪,就敢立这样的战局!
这是真正的撼地擎天!
所有人的震动惊骇间,杜诗怡落下最后一笔汉隶,将所有纸张合拢,轻轻抬眸。电脑屏幕上仍是OpenCv的代码界面,密密麻麻长长短短,望去便知繁难,而镜头下的那双手白皙纤细,在握了一个上午的笔之后,重新拉回键盘鼠标。她的气质依然沉静清丽,看上去和每一个正值青春的年轻女孩相比没有什么不同。
她说:“对,我会尽力。”
五千年风雨长道,三万里盛世江山,无数华夏儿女创造了无数灿烂辉煌的文化瑰宝。只是岁月无情、山河动荡,在这样久的时间流逝里,我们终究失去了许多先人留下的珍贵宝藏,它们一个接一个无声地消散在历史的车轮里,再也无法光耀世间。
但总有一些,能被挽回,能被重现。
金汀遗址136245块帛书碎片,我要你们一个不落,全部归位回家。
作者有话说:
标注一下诗诗写的古文分别出自《桃花源记》《满井游记》《岳阳楼记》
第93章 封神93%
“字形提取?!”
正值盛夏, 碧蓝的天幕上一丝云朵也无,金灿灿的阳光倾照下来,直将树叶都晒化。金汀遗址发掘现场, 领队崔海刚戴上安全帽准备下工地, 乍然就听说了这个消息, 顿时瞪大眼睛。
这四个字在他心里掂量了数个来回, 才像是反应过来似的,惊声道:“她应下了要做这个?真的……可以吗?”
报信的人也肝颤着,哪敢随意接话, 毕竟那样的难度,他光是想一想就开始头痛,连具体实现路径都说不出个一二三,怎么会知道可不可以啊。
但旁边却传来了一句应声。
“应当是可以的。”
“黄教授?”崔海连忙转过身去。
宽旷的发掘现场, 一位老人迎着烈日大步而来。他头发花白,因着常年山里野里的跑,脸上明显有了岁月的痕迹, 精神头却很好,这会儿点一点头, 道:
“她既能一天攻克颜色提取和边缘轮廓提取,必然有真本事。”
他停了停,严肃半生的容色上难得露出个笑影来:“且那小姑娘, 我也算是听说很多年了。”
这话一出众人相视一眼,都从对方眼底看到心惊。黄教授何等人物, 接触到的都是国家栋梁, 能得他这样一句, 那个年轻女孩子绝不简单。
至少是早在上面那里有了名姓。
周遭一时静下来, 黄岚背着手, 眯着眼看远处的探方坑。不管什么时候,那里永远聚集着许多工作人员,有这些年跟着他跑了无数发掘现场的老战友,也有尚且稚嫩的从学校里过来实习的学生。他们全神贯注,在这样大热的天气,穿着厚厚的防护服,围着那些已经露出地表的文物,弯着身子小心翼翼地一寸一寸清理它们周围的泥土。他慢慢道:
“六年前西原帛书出来的时候,我这心里头又是高兴又是难受,北宋书法大家的真迹,又是难得一见的长篇骈文,谁见了不兴奋哪!可是整整七万块啊,全靠我们的研究员手工去拼,多少孩子长年累月不回家,天天在灯下对着那么多比树叶还小的碎片比来比去,又一直悬着心,生怕碰坏了一个半个的,几周下去就全瘦了一大圈。就这还跟我说呢,只要能叫帛书拼完整,叫这好不容易重现天日的珍贵史料能复原,比什么都强!”
“还有老梁那边的竹简,老孟那边的甲骨,几个老家伙嘴上不说,都操心得很呢。而且那摊子,比咱们还不如,咱这帛书虽说碎得厉害,至少都是在同一块地上翻出来的,他们倒好,体量大啊,全国都挖得出来,天南海北的,叫人怎么拼去?就上回,老梁无意中发现陇关和邺泉两地出土的残简里头有几块长得像,大晚上的顿时就睡不着了,一个人爬起来戴着老花镜看了半天,最终证实可以连到一起去,还给我打了老长的电话感慨呢,说真是天意,叫他有运气看见,不然大伙单忙一个遗址都顾不过来,哪还会往异地缀合上想去。”
全国上下数百万碎片啊。
只靠这样一点一点拼下去……
干考古这行,没有怕苦怕累的,可残片缀合工作这样长期停滞,有多少研究进行不下去啊。
烈日当空,空气里的热度闷得人喘不过气,金汀遗址前的高地上没有一个人说话,全都沉默着,看下面无数穿着工作服的人影来来往往。
站了一会儿,黄老也套上工作服要亲自下地去。平时也就罢了,今日天太热,崔海到底还是有点担心,但黄老执意,戴好防护头盔,悠悠道:“行了,谁都别拦,我今儿心里高兴,闲不住啊。”
“三年前,世研部首次提出数字缀合的概念,沈砚亲自带人做出来的高精度扫描引擎,总算叫我们这些老家伙松了一口气。多少年了,终于有不一样的希望在。”
“三年后,又出了杜诗怡。”
“从西原到金汀,中间跨过的是一整个时代。天下是年轻人的,真好。”
***
这个时候,杜诗怡正在写Rosenfeld算法的结束。
自她重新拿过键鼠开始,那个写程序永远行云流水、永远让人生不出一丝半点担心的少女就又回到了大众眼前。景园天色好,气韵也好,极为养人,她这些天来也大多放松,周身气质都是柔和的模样,如今依然清清净净地坐在那里,十指在键盘上灵巧跃动,倒真应了郑飞扬曾经随口一句玩笑话,不像是写代码,像极了在抚琴。