AI-teknik från Google Cloud digitaliserar fem miljoner historiska foton

New York Times digitaliserar sitt omfattande fotoarkiv med hjälp av Google Cloud. Vissa foton är tagna i slutet av 1800-talet och har aldrig visats offentligt.

De fysiska fotografierna (mellan 5–7 miljoner bilder) förvaras i ett gigantiskt arkiv i källaren under New York Times kontor på Times Square. Arkivet – som internt kallas ”the morgue”, bårhuset – innehåller många bilder som inte existerar någon annanstans i världen. De allra flesta innehåller även handskriven information om när de publicerades och varför, men långt från all sådan bakgrundsinformation finns dokumenterad i det fysiska arkivet.

Nu ska 5 miljoner av dessa historiska bilder digitaliseras för att ge tidningens journalister en lättillgänglig historisk referenskälla och samtidigt bevara tidningens historia.

– Arkivet är en skattkista av förgängliga dokument som är en ovärderlig krönika om New York Times historia, men även av nästan ett århundrade av globala händelser som har format vår moderna värld, säger Nick Rockwell, teknisk chef på The New York Times.

Med hjälp av maskininlärningsteknik i Google Cloud Platform kan all bakgrundsinformation som finns på varje bild (oavsett om den är skriven för hand eller på maskin) skannas och kategoriseras med olika taggar (datum, plats osv). New York Times can även dra nytta av Googles bildigenkänningsteknik för att extrahera ännu mer information från bilderna, vilket gör det enklare att katalogisera och hitta för framtida bruk.

Här kan du se en film om hur det hela går till.