今年 Pinkpop 的开局与世界著名的滚石乐队一起精彩。头几天天气很好。周一,节日的最后一天,傍晚时分天气突然开始变坏。就在 Metallica 即将演出之前。音乐节现场 10 分钟内记录到超过 1,500 次闪电,并伴有大雨。
来自 Flickr 的 Pinkpop 风暴(Jan Willem van Wessel)
Pinkpop 的恶劣天气。资料来源: Flickr(Jan Willem van Wessel)
双输的局面
在这种情况下,作为一个组织你应该做什么?看起来你永远赢不了。如果演出被取消,而天气又不太糟糕,人们就会生气。如果他们允许演出继续进行,如果天气确实像预期的那样恶劣,出现人员伤亡,人们会生气的。你必须做点什么,什么都不做实际上是不行的。
科学有帮助吗?
当然,科学无法阻止我们经历极端天气。作为人类,我们当然会通过使用化石燃料和砍伐森林来影响一般意义上的天气。这会影响气候,从而影响天气。 KNMI 最近开发了 14 种新的气候情景,其中极端天气(降水和干旱)更频繁地发生。开发这些类型的场景需要大量的计算。
这也是科学可以做出贡献的领域。让我们看看我们正在讨论什么样的计算。
气候变化
由于气候变化,格陵兰岛的冰层正在融化,大量淡水流入大西洋。这改变了水中的水流,导致水在一个地方上升,而在其他地方下降。
流量、温度和盐
问题是这是否会准确发生、增加或减少多少以及会在多长时间内发生。要预测这一点,您必须观察海洋,例如将其划分为 10 x 10 公里的网格。在网格的每个方框中,您可以测量温度、水中的盐含量和流速。在此基础上,您可以计算有多少水被输送到下一个隔间。
该部分也有其自己的流速、温度等。水流也会影响冰的融化,导致添加更多或更少的水。这是一个庞大的因果系统,如果你想要一个好的模型,你必须计算至少100年的时间,才能有一个可靠模型的起点。
大数据:图形处理单元
当谈到大数据时,气候变化就是一个很好的例子。那么用几个 CPU 就可以计算出这个,对吧?不,您实际上并不需要 CPU,您需要图形处理单元 (GPU)。这些处理器用于个人电脑和游戏机上的电脑游戏的显卡。 GPU 拥有数千个所谓的核心,可以执行简单的计算,这与普通 CPU 不同,后者只有 8 个核心(可以执行更复杂的计算)。 GPU 每秒可处理高达 200GB 的数据。
荷兰研究计划 COMMIT/ 正在研究一种基础设施和方法,可以处理这些类型的问题,并且您可以通过它尽可能优化地使用 GPU。这使您可以优化流程并减少所需的时间和能源,这对环境更好。
然而,科学的贡献并不止于此。
公众的想法是什么?
智能手机和 Twitter 为人们提供了一个平台来分享他们正在做的事情、受(仅举几个例子)。我们第一次可以轻松地大规模监控人群的消息和情绪。
来自 Flickr 的 Pinkpop 风暴(Jan Willem van Wessel)
Pinkpop 的恶劣天气。资料来源:Flickr(Jan Willem van Wessel)
分析推文的挑战
COMMIT/ 正在研究如何衡量人们的感受和情绪,例如在 Pinkpop 等音乐节上。这是 捷克共和国数字数据 通过分析有关 Pinkpop 的推文来完成的。这确实带来了许多挑战:
只分析那些真正与 Pinkpop 相关的推文。
识别推文中的情绪或心态。
仅过滤实际参加节日的人(如果您想衡量参加节日的人的感受)。
前两个挑战可以通过使用主题标签和关键字轻松解决。搜索 Pinkpop、#PP2014 或 #Pinkpop2014 比分析一条推文并推断它应该与 Pinkpop 相关要容易得多。
系统如何识别有关 Pinkpop 的推文?
根据位置(舞台上)、乐队名称(滚石乐队)和时间(发送推文的时间),算法可以推断出这是关于 Pinkpop 的,但为了做到这一点,系统仍然必须具有相当多的知识。它必须能够理解“在舞台上”的含义,即滚石乐队正在表演(节目的知识)以及将所有这些结合在一起的逻辑。
我们的语言很灵活,这只是有关滚石乐队表演的推文示例。还有更多的推文描述了本质上相同的事情。从推文中提取情感甚至更加复杂,但如果人们使用像 #looking for 或 #notlooking to it 这样的主题标签,问题就更容易解决。还可以使用这些推文来训练“垃圾邮件过滤器”来识别这些类型的推文,即使它们不包含此类标签。