繼谷歌華為之後 亞馬遜發布首款雲AI晶片 將於明年面世
2025-02-25 18:02:24
11月29日,據外媒TechCrunch報導,在拉斯維加斯舉行的AWS re:Invent2018大會上,
亞馬遜雲CEO Andy Jassy發布了首款雲端AI晶片——Inferentia。
Andy Jassy在發布會上說,「Inferentia將是一個高吞吐量、低延遲、可持續性能強、高性價比的處理器」。
據官方介紹,Inferentia定位於一款低成本、高性能、低延遲的機器學習推理(inference)晶片。至於晶片的詳細參數官方公布不多,只公布了一些核心賣點,比如其計算力將會高達幾百TOPS,多晶片組合後算力可達數千TOPS。此外,Inferentia支持FP16、INT8精度,並支持TensorFlow、Caffe2、ONNX等流行機器學習框架。
目前,AI 專用晶片在性能指標上最為強大的是華為今年 10 月推出的昇騰 910,據稱其半精度(FP16)算力可達 256TFLOPS,最大功耗為 350W。
在雲服務方面,亞馬遜正在成為行業領導者,而其推出的 AI 晶片與定製化 CPU,勢必更將鞏固其領先地位。
至於Inferentia會在何時正式推出,Andy Jassy 表示預計將於2019年下半年正式上市。