版本12.0中的一个示例是ImagePyramid框架,用于执行多尺度图像处理:
$ z$ Z- T% P; {9 m S) g2 j
- h: D" x3 l5 p/ y* c3 l0 y( R! h/ B1 U
版本12.0中有几个与颜色计算有关的新函数。一个关键的想法是ColorsNear,它代表感知色彩空间中的一个邻域,这里的颜色为Pink:
! T* C7 }0 t3 t) v# m6 Z: c% `; {, A( j; ] h5 l8 ^
例如,可以在新的ImageRecolor函数中使用颜色邻域的概念:
( d0 J* z) H. f0 K& @$ ]/ O8 L0 [7 L
语音识别及更多音频功能
7 Z/ J0 H! a; j) T9 ~: P当我坐在电脑前写这篇文章的时候,让我对电脑随便说句话,然后记录它: " u0 ?: L/ }, J
7 T" }4 N% z( I: a8 C) D" h& H
这是我获得的音频频谱图:
I! ?& Q2 f+ E8 ^7 {: {
6 T$ V' C# a2 ?- p0 r* s2 [% o
此操作在版本11.3中即可执行(但在12.0中Spectrogram的速度提高了10倍)。而新功能是:
3 I4 S" H+ h5 B3 U2 [. @. @& R% T# @' T- `5 J
我们正在使用最先进的神经网络技术,实现从语音到文字的转变!它流线型的工作效果好得令我吃惊,并且完全能够处理很长的音频片段。在典型的计算机上,转录速度大约等于实际的语音速度,因此一小时的语音将需要大约一个小时来转录。
% K+ I/ A6 K; I/ ?& O现在我们认为SpeechRecognize仍是实验性的,我们将继续增强它。但有趣的是看到另一个重要的计算任务现在变成了Wolfram语言的一个单个函数。
4 b$ |' |' N* N; V! |% T. c* F在12.0版中,还有其他增强功能。SpeechSynthesize支持新语言和新语音(由VoiceStyleData[]列出)。 2 N$ [; k: M2 d; S0 v1 \+ }' D
有WebAudioSearch——WebImageSearch的对照版,可以让你在网上搜索音频:
U4 n4 w/ h2 y, U9 X
/ e* t6 D/ Y1 F) ~) s( j# c3 j可以提取实际的音频对象:
3 J+ u. }; b/ W0 z' @6 r9 L
9 A$ j: b% [1 Q0 T5 e$ m: {
然后制作光谱图或其他测量结果的图形:! v( R! `7 }7 s
; @) F9 A1 h7 k6 \4 M" f
版本12.0中的新功能在此:可以使用AudioIdentify来尝试识别声音的类别(这是一只会说话的公鸡吗?):
4 {! X' [ b: {3 l
( H8 a$ l. `) ]( `: p我们认为AudioIdentify仍在试验阶段。这只是一个有趣的开始,还不像ImageIdentify那样好用。
/ `( B) }2 p0 Q$ L5 f/ F: p, R- y( \更成功的音频函数是PitchRecognize,它试图识别音频信号中的主导频率(它使用“经典”和神经网络方法)。虽然它还不能处理“和弦”,但它对“单音符”非常有效。 5 X; h' d$ R& a8 Q% s# t6 u# {& \
在处理音频时,人们通常不仅要识别音频中的内容,还要添加注释。版本12.0开始引入了大规模音频架构。现在AudioAnnotate可以标记静音的位置,或者有大声的地方。将来,我们将添加说话人识别和单词边界,以及其他许多内容。除此之外,我们还有像AudioAnnotationLookup这样的函数,用于挑选以特定方式注释的音频对象的部分。
/ g3 V1 [+ u s8 @; l1 p所有上述高级音频功能都建立在一个完整的低级音频处理基础之上。版本12.0大大增强了AudioBlockMap(用于将滤波器应用于音频信号),并引入了ShortTimeFourier等函数。 ) C' R" t: a) d( [
频谱图看起来有点像乐谱的连续模拟,其中音高被绘制为时间的函数。在版本12.0中,现在有InverseSpectrogram,将一系列频谱图数据转成音频。从1991年的第2版开始就有了Play,根据一个函数生成声音(比如Sin[100 t])。现在使用InverseSpectrogram,我们可以将“频率-时间位图”转变为声音。(并且必须承认,当只有振幅信息时,关于相位的最佳猜测仍是棘手的问题。)
/ Q! Z! ^" g- ^& A) j2 {5 C) U5 N自然语言处理
: R) K4 b* \. D3 V& P- ^, b从Wolfram|Alpha开始,我们长期以来拥有非常强大的自然语言理解(NLU)功能。这意味着,给定一种自然语言,我们擅长将其理解为Wolfram语言,然后由此进行计算: / y' o0 t1 V$ b) x1 t. I! I9 c
3 u9 N) W/ C2 C! P' U7 z" o
但是在自然语言处理(NLP)方面,如果我们输入一大段自然语言,但不试图完全理解它们,而只是找到或处理它们的一些特定功能,又怎样呢?一段时间以来,像TextSentences,TextStructure,TextCases和 WordCounts这样的函数已经在这个方面为我们提供了基本功能。在版本12.0中,通过利用最新的机器学习技术,以及我们长期的NLU和知识库功能,强大的NLP功能已经开始崭露头角。 ( s5 q( ?8 ], n
核心是TextCases的显著增强版本。TextCases的基本目标是在一段文本中查找不同类型内容的实例。一个例子是“实体识别”的经典NLP任务,在这里TextCases找到哪些国家名称出现在关于ocelots的维基百科文章中:
% m. s+ }/ J1 @) a" v0 S2 p W4 K" F
7 k6 ^: c1 N3 p9 ~我们也可以问一下提到哪些岛屿,但现在我们不会要求Wolfram语言解释:. @, O9 j3 k }
' }7 j% Z( B6 ]7 L3 D& B- @! p
TextCases并不完美,但它确实表现出色:
7 z# \; d! p; H9 ~- Q
: Y8 N: D* H$ I8 p- v) S e它也支持许多不同的内容类型(https://reference.wolfram.com/la ... xtContentTypes.html)% M3 a' T! |( {
3 g- C9 B0 O. S! N l) O$ M- [您可以要它查找代词或简化关系从句,量词,电子邮件地址,或150种实体(如公司、植物或电影)中出现的任何一种。您还可以要求它挑选出特定人类语言或计算机语言的文本,或者关于特定主题(如旅行或健康)或具有正面或负面情绪的文本。您可以使用像Containing这样的结构要求这些东西的组合(如包含河流名称的名词短语):
& w0 I& ?# l6 l- ?+ T
. W, N$ F( T. W: f& S& P+ u6 _例如,TextContents可以让您查看在特定文本中检测到的所有实体的详细信息:5 Y4 E( _! q+ Z a( U
" F# a# M- O* }3 \
并且,是的,原则上可以通过FindTextualAnswer使用这些功能来尝试回答文本中的问题。但在这种情况下,结果可能非常古怪:
9 r" u/ W9 J' Z% c! W
6 Q/ P# Z9 b" O. a4 I3 {当然,您可以从我们内置的策展知识库中获得真正的答案:
7 I/ X3 B3 @8 |: X1 p
# v s4 }% a" I: h6 a& X Y顺便说一句,在版本12.0中,我们添加了各种小的“自然语言便利功能”,如Synonyms和 Antonyms:
% l+ s- Q: L! x
8 H) B5 M* v) R/ J2 v: i7 g# ]# l) O
计算化学 u. r$ @. T0 F1 W; {7 y
12.0版在计算化学方面带来了“惊喜”。我们的知识库中在很久以前就有了显式已知化学品数据。但是在版本12.0中,我们可以对指定为纯符号对象的分子进行计算。以下是我们如何指定最终成为水分子的方法:
0 \# [% h7 ^3 U5 @2 N& ^以下是我们如何进行3D渲染:
8 D: \1 M& W) A9 }4 F# B! k7 p
- l9 M) E; I( f- q, _5 l可以处理“已知化学品”:
1 C0 m7 P7 h% \! \0 B
/ A& [7 w& c, x2 C& N" N4 V- ^
可以使用任意IUPAC名称:
& w9 ^; O) v4 K1 i
; {+ U3 |" q9 M# b0 E6 m& I或者可以“编造”一个化学品。例如通过其SMILES字符串指定它们:+ D; _! i7 R. F7 _7 ]% r
7 ?8 R8 l6 i$ B; |$ o0 e g$ \$ Y但我们不仅能生成图片,还可以根据结构进行计算,如对称性:
) [, J# i4 i* ?5 a
/ [6 A$ p7 E/ H给定一个分子,我们可以突出显示其碳氧键:
( H7 C/ y! Y7 @; x8 b5 ^! C, \" J
或者突出显示结构,例如由SMARTS字符串指定(这里是任何5个成员的环):1 c; Z: L# W+ ~# d: @8 }
8 E) r v& @( T' ^0 J也可以搜索“分子模式”;结果以原子数表示:
9 n! e. d! @; t4 D$ A- w% `
, \1 f. g: d9 O" g& ^% I4 c S我们在版本12.0中添加的计算化学功能颇具通用性并且功能强大(需要注意的是,到目前为止它们只涉及有机分子)。在最底层,它们将分子视为标号图,其中图的边对应于键。但他们也了解物理学,并正确地解释原子价和键配置。不用说,有很多细节(关于立体化学,对称性,芳香性,同位素等)。但最终结果是分子结构和分子计算现已成功地添加到整合到Wolfram语言的区域列表中。 & S0 a4 e8 \! M# l6 Y
地理计算扩展
+ N; h! k1 X/ h& j6 d$ A% Z; fWolfram语言已具备强大的地理计算功能,但12.0版增加了更多功能,并对已有功能进行了增强。
( ]7 y! Q1 B0 x: k例如,现在有RandomGeoPosition,它生成一个随机的维度-经度位置。这看上去似乎微不足道,但当人们不得不进行坐标变换时,就看到它的威力了,人们可以告诉它只在某个地区内选取点,这里是法国:
( K! |0 O* t* k0 h4 s# J
2 L. [ u2 z! t1 @在版本12.0中,新地理功能的一个主题是不仅处理地理点和区域,还处理地理矢量。例如,这是当前在艾菲尔铁塔处的风矢量,表示为GeoVector,具有速度和方向(还有GeoVectorENU,它提供东,北和上分量,以及GeoGridVector和GeoVectorXYZ):
- w7 k1 i$ _: j# n% _/ {
2 F; E1 Q i2 H( e& @2 |3 `
像GeoGraphics这样的函数可以可视化离散的地理矢量。GeoStreamPlot是StreamPlot(或ListStreamPlot)在地理方面的对照,并显示由地理向量(此处来自WindDirectionData)形成的流线:
6 {# R9 l4 y# Y4 }8 o8 L
# i/ o. a! {+ K7 _+ e
大地测量学是一个在数学上相当复杂的领域,我们为Wolfram语言在此方面的卓越性能而感到自豪。在12.0版中,我们添加了一些新功能来填充一些细节。例如,我们现在有像GeoGridUnitDistance和GeoGridUnitArea这样的函数,它们提供与地球上每个位置(或月亮,火星等)的不同地理投影相关的失真(基本上是雅可比行星的特征值)。 ) V0 ~7 Y$ U. e5 ^2 q; p" w
增强的可视化功能
1 S/ N$ i( Q( M+ e7 C我们一直在稳步发展的一个可视化方向被人们称之为“元图形”:图形化事物的标注和注释。我们在版本11.0中引入了Callout;在版本12.0中,它已经扩展到3D图形:
; N& \! R3 n9 b3 g' y
S3 g% G7 d' F R- S: ?即使对于比较复杂的物体,它也能很好地确定标记其位置:
4 t( Y2 w Y b: Z! i
6 q, W2 E1 b$ |7 }, W) |8 I/ \9 F
为了让图形更加美观,对很多细节的改进非常重要。在版本12.0中增强的功能是确保图形各列沿边框排列,而不管其刻度标签的长度如何。我们还添加了LabelVisibility,它允许您指定不同标签应该可见的相对优先级。
* f7 j3 ?9 I. u" n3 v5 L# i4 g: |8 x版本12.0的另一个新功能是多面板绘图布局,其中不同的数据集显示在不同的面板中,但面板尽可能地共用坐标轴: & s; r! X0 J7 G& }) `$ Y8 f. g
/ H- @4 {# ^) h/ {加强知识库集成 / q2 k( |( f, ~1 \8 t& l8 g& ?- b5 S
我们的策展知识库非常庞大且不断增长,它驱动着Wolfram|Alpha。随着Wolfram语言的每次版本发布,我们逐渐将其融入语言的核心。
4 O+ U5 e; n/ h) ]# U, N" F在版本12.0中,我们直接在语言中公开了数百种类型的实体:
! m: k* Z6 Q# M
! } l0 [; y! L% f4 m7 \! N) g, A Y. l& H0 h% `& m
在12.0版之前,许多类型实体记录在Wolfram|Alpha的示例页面。但现在所有这些都收录在Wolfram语言参考文档中心:' o6 f R* m+ q. \/ I' y3 J; e
" L% k ]* y+ t, r5 _" M
仍有像SatelliteData,WeatherData和FinancialData这样的函数来处理通常需要复杂选择或计算的实体类型。但在版本12.0中,可以使用自然语言(“control+ =”)输入和“黄色框”实体和属性以相同方式访问每个实体类型:
) W/ R1 z+ B% W# y. Q
) e7 S1 Z/ n- Z+ v5 M* A顺便说一句,人们也可以隐性使用实体,比如这里求具有最高已知熔点的5个元素:) _, O* O# i1 t) G0 K
9 m, c8 j. g& u! b6 N2 e$ O* U并且可以使用Dated获取时间序列值:
8 ^* C1 }2 v# \3 ]; z
8 \& p+ P# @' q( g* p! `7 h
与外部数据库的大数据集成
y; O; S* t( t m使用Wolfram知识库中的内置数据非常方便。查询实体的相关属性非常方便: - s( l8 G( ?$ p% x! a
' h# f( s! p) t+ K s
8 l/ p' a( b, y
但是如果你有自己的数据怎么办?能否对它进行设置,使其可以像这样轻松地使用吗?版本11的一个主要新功能是添加了EntityStore,可以定义一个自己的实体类型,然后指定实体、属性和值。 1 }) B4 U/ O! c$ g1 o+ ^
WolframData Repository 包含了一堆实体范例。这是其中一个:
2 ^) A, E/ ]3 ? `% d$ J
# |4 y6 h/ J7 C3 v) }
3 N& q" S: B: q' E( i1 @2 s它描述了单个实体类型:“SWLibraryBook”。为了能够像内置实体一样使用这种类型的实体,我们“注册”实体存储:
% |' E5 b D+ c- U% n现在我们可以做一些事情,比如要求10个类型为“SWLibraryBook”的随机实体:- G) t" e) A' G# P3 `
Q7 F( A/ p: H- l7 Y, l$ O' u
实体存储中的每个实体都具有各种属性。这是一个特定实体的属性值数据集:% w( p) m) \( b; _) \
V3 Z5 @" I5 a通过这种设置,我们基本上是将实体存储的全部内容读入内存,这使得执行Wolfram语言运算非常有效。但是,对于大量数据而言,它并不是一个很好的可扩展解决方案- 例如数据太大而无法容纳在内存中。 8 v3 A6 h+ X" `0 m1 j4 Q0 }! c
但什么是大数据的典型来源?通常它是一个数据库,通常是一个可以使用SQL访问的关系数据库。我们使用DatabaseLink软件包对SQL数据库进行低级读写访问已有十多年。但是在版本12.0中,我们添加了一些主要的内置功能,允许在Wolfram语言中处理外部关系数据库,就像实体存储或Wolfram知识库的内置部分一样。 ; ^0 y" y7 v$ P. f5 z
让我们从玩具示例开始吧。这是一个恰好存储在文件中的小型关系数据库的符号表示:
# ?( }& r9 P% a! o- x' \& ~我们立即得到一个汇总数据库内容的框,并告诉我们这个数据库有8个表。如果我们打开框体,可以开始检查这些表的结构:8 r& d6 Z( Y, B' c3 S! r
* h: X0 J- k- y4 }" a: a
$ }) q; r# x6 O+ G( h2 v7 F
然后,我们可以将此关系数据库设置为Wolfram语言中的实体存储。它看起来与上面的库实体商店非常相似,但现在实际的数据没有被放内存;相反,它仍然在外部关系数据库中,我们只是在Wolfram语言中定义一个(“类ORM”)映射到实体:5 T2 \- M5 I+ A+ {, C8 Z5 w
2 c9 n; d7 l+ _( z3 J- A1 L+ `
2 [: z& I0 g! E2 ?. B3 m- o
现在我们可以注册这个实体存储,它设置了一堆实体类型(至少在默认情况下),以数据库中表的名称命名:
, A6 \1 v" Y0 Q! {, o. w
- V( F2 n2 U |1 S7 r! b现在我们可以对这些实体进行“实体计算”,就像我们在Wolfram知识库中的内置实体一样。这里的每个实体都对应于数据库中“employees”表中的一行:; F4 G% c+ |* V+ l2 ^; j
$ a) L g( d4 o/ U0 |0 x, Q对于给定的实体类型,我们可以询问它具有哪些属性。这些“属性”对应于底层数据库中表的列:5 Q0 R# r k* [# o3 R9 f/ B/ d
' W* G) S' ~- `3 Q6 r: R现在我们可以询问特定实体的特定属性值:6 x W N N* u. {
# L- O- O) ]+ [$ k" p+ m0 W我们也可以通过给定标准来挑选实体; 在这里,我们要求“payments”实体具有“amount”(金额)属性的4个最大值:
3 z- \: J7 g1 [% k' \5 e
0 S! c7 J) p; w" E- Y+ W* L) N
我们同样可以询问最大金额值:
' R/ t8 F! h- C1 y0 n" I9 R/ |8 [ g
但是在这里它变得更加有趣了:到目前为止,我们看见的是一个文件支持的小数据库。但我们也可以对外部服务器上的巨型数据库做同样的事情。
4 W3 `% [" e: C) M例如,让我们连接到TB级的OpenStreetMap PostgreSQL数据库,该数据库包含几乎全部世界街道地图的数据:
5 ^* A8 s N% _6 J6 B0 b6 l" ~
9 ?) J, ]: ~$ k; ~5 Q `+ t1 Y v和以前一样,让我们将这个数据库中的表注册为实体类型。像大多数野外数据库一样,结构中存在一些小故障,这些故障已被绕过,但会产生警告:$ M! k/ V9 W; B7 k8 k1 g8 m
+ Q1 j. D7 X" y: D+ i T4 }- P
但现在我们可以询问有关数据库的问题,比如世界上所有街道上有多少个地理点或“节点”(是的,这是一个很大的数字,这正是数据库很大的原因):
. B% S* @( u Q4 E7 Y4 \& j% D. a( ]8 Z# |$ g2 g
在这里,我们要求(101 GB)的planet_osm_polygon表中具有10个最大(投影)区域的对象的名称(是的,只需不到一秒): \( Z" R0 Z. B) Q% [, g; F& }
2 J5 Y+ t" K6 H0 H3 a这一切是如何运作的?过程基本是这样,我们的Wolfram语言表示被编译成低级SQL查询,然后将其发送以直接在数据库服务器上执行。
1 @ {* S: q, T1 ^1 M5 F有时您需要的只是最终值(例如,上面的“amounts”)。但其他情况下,一些中间值也是需要的,比如以特定方式选择的实体集合。当然,这个系列可能有十亿个条目。因此,我们在版本12.0中引入的一个非常重要的功能是,我们可以纯符号式地表示和运算这些事物,仅在最后将它们解析为特定的事物。 5 J0 Z+ I( |2 H5 z2 M
回到我们的玩具数据库。下面这个例子可以说明我们如何通过聚合具有给定国家值的所有客户的总creditLimit来获得实体类别: ( I0 {6 Y3 G1 p- n& z
6 M, I- }8 p( w. a6 p) ~4 [起初,这只是符号表示。但如果我们要求具体值,则执行实际的数据库查询,这样我们得到了具体的结果:
- O3 `, W2 o i* m: J. a有一系列新功能可用于设置不同类型的查询。这些函数不仅适用于关系数据库,还适用于实体存储以及内置的Wolfram知识库。因此,我们可以在元素周期表中询问给定周期的平均原子质量:& G+ P$ L! {+ P; f t8 B
" c9 a! ? ~6 ^一个重要的新结构是EntityFunction。EntityFunction与Function类似,不同之处在于其变量表示实体(或实体类),并描述可以直接在外部数据库上执行的操作。这是一个内置数据的例子,我们在其中定义一个“筛选”实体类,其中筛选标准是一个检验总体值的函数。该FilteredEntityClass本身只是符号表示,但EntityList实际执行查询,并解析(这里为未排序)实体的显式列表:
- @; \8 k2 y; R4 s' [
1 s! W( {( z; P* p
( {8 Z7 b1 {. M9 j( Z: Q1 D I4 K
除了EntityFunction、AggregatedEntityClass和SortedEntityClass之外,版本12.0还包括SampledEntityClass(用于从类中获取一些实体),ExtendedEntityClass(用于添加计算属性)和CombinedEntityClass(用于组合来自不同类的属性)。通过这些原语,可以构建“关系代数”的所有标准运算。 5 @# B5 J% F# y* L
在标准数据库编程中,人们通常最终会得到一整片由“joins”和“foreign keys”等组成的丛林。我们的Wolfram语言表示允许您进行更高级别的操作,其中“joins”(连接)变为函数组合,而“foreignkeys”(外键)只是不同的实体类型。(但如果要进行显式连接,则可以使用CombinedEntityClass。) * n: g" R7 E3 x* q* L
所有这些Wolfram语言结构都被编译成SQL,或者更准确地说,是与您正在使用的特定数据库相匹配的SQL的特定方言(我们目前支持SQLite、MySQL、PostgreSQL和MS-SQL,对OracleSQL的支持即将推出)。当我们进行编译时,会自动检查类型,以确保您获得有意义的查询。即使是相当简单的Wolfram语言规范也可能最终变成许多SQL行。例如,
- X. P) I' j* U7 ^" l" \/ p
# x+ |7 o1 `$ _) i) A' c将生成以下中间SQL(此处用于查询SQLite数据库):* }7 C2 i* C7 N" y5 T, o
% x3 T+ y) p* i9 Z& k* V
12.0版的数据库集成系统非常复杂,为此我们已经奋斗多年。这是朝Wolfram语言直接处理大数据中的“大”迈出的重要一步,并让Wolfram语言直接在TB级别的数据集上进行数据科学研究。比如查找世界上哪些街头实体的名字中有“Wolfram”:
: f5 z3 U; a6 w- H; o5 d& d
3 X1 F8 [/ R0 ^' P* X; T
% m0 H8 e9 `" H+ s# s8 U5 k% ^' x# v& `" F& b& C
4 h8 T3 G, P9 S. Z! w. H3 N |