机器学习可以有什么样的实际应用?最先进入脑海的答案,无外乎语音识别、人脸识别、机器翻译、自动驾驶,以及个性化推荐这些热门领域。
但你或许不知道,它还能让蔬菜变得更好吃。
近日,麻省理工学院研究团队联合Cognizant公司,尝试了一系列香料九层塔(罗勒)的种植实验。他们没有采用转基因技术,仅用普通的九层塔种子,通过机器学习算法控制生长环境,使其时刻处于最利于生长的状态,调节参数包括光照时间、紫外线照射时间和有效光照辐射(PAR)等。
最终发现,24小时光照竟然是最适宜九层塔生长的环境因素之一,培育出的成品味道远超普通九层塔。未来,研究团队计划用类似的方法提高植物产量,甚至是提高它们体内特定物质的含量,帮助对抗一些疾病。
图| 试验中所有九层塔的生长环境,包括光照,都受到了严格的控制(来源:MelanieGonick)
评判标准
结合机器学习和植物种植,并非心血来潮。麻省理工学院早在2015年,就提出了OpenAgriculture(开放农业)倡议,致力于将人工智能技术应用在农业领域,同时秉承开源精神,将研究成果以软硬件结合的形式共享给所有人,提高全球农业技术的整体水平。
之所以选择九层塔,是因为它是一种西方料理中常见的香料,被誉为“香料之王”。由于可以散发出浓郁的香气,它在西餐中的地位相当于我国美食里面的香菜。甚至在三杯鸡、烧茄子等中式菜肴中也会有它的身影。
研究人员正是利用这种特点,通过气相色谱-质谱联用法(GC-MS)分析它的香气浓度,进而评估它的味道,参考成分多达十余种。
总的来说,九层塔香气越浓,味道越好,而且还会含有更丰富营养素和抗氧化物质,更有营养。
控制变量
在“九层塔香气优化”实验中,研究人员使用了无土水培技术,将所有九层塔装在适合运输的容器中,再放入由电脑控制的培育室里。他们将整套设备称为“食物计算机”,可以精准控制环境变量。
在保持温度和湿度等参数恒定的前提下,研究团队选择了三种变量:光照时长,紫外线时长和光合有效辐射(PAR)时长。
光照时长很好理解,它与绿叶植物的生长效率密不可分,决定了储存香气挥发物的毛状体的形成,变量值在0-24小时之间。紫外线的作用则在于增加香气挥发物的含量,进而用来检验实验成果,变量值也在0-24小时之间。
图|“食物计算机”
而光合有效辐射比较特殊,它代表着可以用来进行光合作用的光照,由灯的种类决定。比如两株植物各配有一台经过特殊设计的灯,即使照射时长相同,发出的有效辐射也有差异,最终进行的光合作用也有不同。这一变量最难控制和改变,因为它对硬件需求较高,而且需要特殊的优化算法才能找到最佳配置。
设计优化模型
面对三个变量衍生出的数百万种排列组合,如何找到效果最好的一种?研究人员将目光投向了机器学习。
他们选择了符号回归(SymbolicRegression)方法,其优点在于不依赖于现有知识,可以有效利用进化方法,为非线性系统建立预测和优化模型。该方法还比其他回归模型更易于解释,研究人员更容易找出变量之间的关系,为未来的实验开发新模型。
图|“生物计算机”产出的九层塔(来源:MelanieGonick)
优化过程中,除了上述三个变量,符号回归模型还会考虑温度、湿度和香气挥发物浓度等信息,将它们作为输入值,评估优化方法。
研究人员强调,尽管符号回归在多次迭代后无法保证收敛,但实验当中的预测只需一次迭代,无需保证收敛。
种植实验
种植实验进行了三轮,每一轮包括9盘同时生长的九层塔,其中每轮会有3盘一直使用控制参数,来作为衡量标准。
第一轮的环境参数由人工决定,主要目的是调查紫外线的效果和灯的选择。第二轮参数由无监督算法选择,加入了光照变量和提高了参数多样性。
在分析了前两轮的生长数据后,第三轮参数由符号回归模型给出。具体来说,该模型一共评估了200万种组合方案,研究人员从中挑选了18种效果最好的,应用于种植实验中。
最终结果显示,九层塔在24小时光照的情况下,生长状态最好,释放的香气也最浓郁。
图|三种变量组合而成的结果图,好吃程度由高到低分别是:红色>黄色>绿色>蓝色
这一结果十分出人意料,因为大自然中极少出现24小时日照的情况,只有在极地地区才会发生,但那里又不适合植物生长。
在此之前,以自然种植测试为主的农业领域,几乎没有可能发现这种看似“反直觉”的特征,即使人们知道24小时光照会让特定植物生长旺盛,但并不知道这还会影响到它们的味道。
除了味道以外,研究人员正在尝试更多种机器学习和农业的结合方式。比如探索环境变量对营养素和其它成分的影响,寻找是否可以利用机器学习提高某些成分的含量,让食用植物变得更加营养,产量更高,甚至是适应气候变化和抵抗害虫。
这项研究成果发表于4月3日的 《公共科学图书馆·综合》(PLoSOne)期刊上。