论文标题

多模式的语义转移从文本到图像。通过分布语义的细粒度图像分类

Multimodal Semantic Transfer from Text to Image. Fine-Grained Image Classification by Distributional Semantics

论文作者

Donig, Simon, Christoforaki, Maria, Bermeitinger, Bernhard, Handschuh, Siegfried

论文摘要

在过去的几年中,艺术历史和遗产信息学领域中的神经网络等图像分类过程经历了广泛的分布(Lang and Ommer 2018)。这些方法面临着几个挑战,包括在数字人文科学中处理相对少量的数据以及高维数据。在这里,使用了卷积神经网络(CNN),即像往常一样输出一系列纯文本标签,而是一系列语义上加载的向量。这些向量是由分布语义模型(DSM)产生的,该模型是由内域文本语料库生成的。 ------- 在Den Letzten Jahren帽子中,verwendung von bildklallyungsverfahren wie Neuronalen netzwerken auch im bereich im bereich deristischen bildischen bildwissenschaften und ter Heritage Informatics weite weite verbreitung gefunden(lang und und oundOmer 2018)。 Diese Verfahren Stehen Dabei Vor Einer Reihe Von Herausfordorungen,Darunter Dem umgangmit den den vergleichsweise kleinen kleinen datenmengen sowie sowie zugleich zugleich hochdimensionalen da-tenräumenin den den digitalen geisteswissenschaften。 Meist Bilden Diese Methoden DieKlallasifizierung auf Einen vergleichsweise flachen raum ab。 Dieser Flache Zugang verliert imbemühenum ontologische eindeutigkeit eine reihe von seciessenen dimensionen,darunter taxonomische,Mereologische undsogiative bezieHungen zwischengen zwischenden zwischenden zwischenden klassen klassen klassen beziehungsweise dem nichnichtext。 Dabei Wird Ein卷积神经网络(CNN)Genutzt,Dessen Ausgabe IM训练培训,Anders Als AlsHerkömmlich,Nicht Auf Einer Serie Serie flacher Textlabel Beruht,Sondern Auf Einer auf Einer Serie Serie serie serie vonvonvonvonvonvonvonvonvonvonvonvonvektoren。 diese vektoren ructieren aus einem分布语义模型(DSM),韦尔奇aus einem einemdomäne-textkorpusgeneriert wird。

In the last years, image classification processes like neural networks in the area of art-history and Heritage Informatics have experienced a broad distribution (Lang and Ommer 2018). These methods face several challenges, including the handling of comparatively small amounts of data as well as high-dimensional data in the Digital Humanities. Here, a Convolutional Neural Network (CNN) is used that output is not, as usual, a series of flat text labels but a series of semantically loaded vectors. These vectors result from a Distributional Semantic Model (DSM) which is generated from an in-domain text corpus. ----- In den letzten Jahren hat die Verwendung von Bildklassifizierungsverfahren wie neuronalen Netzwerken auch im Bereich der historischen Bildwissenschaften und der Heritage Informatics weite Verbreitung gefunden (Lang und Ommer 2018). Diese Verfahren stehen dabei vor einer Reihe von Herausforderungen, darunter dem Umgangmit den vergleichsweise kleinen Datenmengen sowie zugleich hochdimensionalen Da-tenräumen in den digitalen Geisteswissenschaften. Meist bilden diese Methoden dieKlassifizierung auf einen vergleichsweise flachen Raum ab. Dieser flache Zugang verliert im Bemühen um ontologische Eindeutigkeit eine Reihe von relevanten Dimensionen, darunter taxonomische, mereologische und assoziative Beziehungen zwischenden Klassen beziehungsweise dem nicht formalisierten Kontext. Dabei wird ein Convolutional Neural Network (CNN) genutzt, dessen Ausgabe im Trainingsprozess, anders als herkömmlich, nicht auf einer Serie flacher Textlabel beruht, sondern auf einer Serie von Vektoren. Diese Vektoren resultieren aus einem Distributional Semantic Model (DSM), welches aus einem Domäne-Textkorpus generiert wird.

扫码加入交流群

加入微信交流群

微信交流群二维码

扫码加入学术交流群,获取更多资源