Amazon heeft aangekondigd dat het de end-to-end latency van Alexa en van de Amazon Rekognition-dienst heeft verlaagd met 25%, en de kosten met 30%. Dit heeft het bewerkstelligd door van Nvidia-gpu's over te stappen op zijn eigen Inferentia-cpu's. Tot nu toe gebruikte Amazon voor de machine learning-taken die voor Alexa vereist zijn Nvidia-videokaarten. Vermoedelijk ging het om de Tesla T4 (die inmiddels gewoonweg 'Nvidia T4' wordt genoemd op basis van Turing. Amazon heeft echter niet explicie...
Continue reading...
Continue reading...