HWI Amazon verlaagt Alexa-latency door Nvidia-GPU's te verruilen voor eigen chips

HighFlow · 14 november 2020

Amazon heeft aangekondigd dat het de end-to-end latency van Alexa en van de Amazon Rekognition-dienst heeft verlaagd met 25%, en de kosten met 30%. Dit heeft het bewerkstelligd door van Nvidia-gpu's over te stappen op zijn eigen Inferentia-cpu's. Tot nu toe gebruikte Amazon voor de machine learning-taken die voor Alexa vereist zijn Nvidia-videokaarten. Vermoedelijk ging het om de Tesla T4 (die inmiddels gewoonweg 'Nvidia T4' wordt genoemd op basis van Turing. Amazon heeft echter niet explicie...

Continue reading...

HWI Amazon verlaagt Alexa-latency door Nvidia-GPU's te verruilen voor eigen chips

HighFlow

Moderator