Как сообщает источник, китайское правительство поставило перед собой весьма неординарную задачу — за три года сравняться с США по уровню развития технологий искусственного интеллекта, а к 2030 году стать мировым лидером в этой области.
Цель достаточно амбициозна и не может быть достигнута простыми способами. Поэтому в списке необходимых шагов, кроме прочего, значится и разработка собственного ускорителя для работы с нейронными сетями.
Напомним, Tesla M40 основан на GPU GM200 поколения Maxwell. Этот графический процессор выпускается по 28-нанометровому техпроцессу, содержит 3072 ядра CUDA и состоит из 8 млрд транзисторов. Да, это далеко не самый современный GPU Nvidia, однако и он весьма и весьма сложен. Особенно, если учесть, что Nvidia создавала его, имея за плечами огромный опыт разработки GPU. А тут Китай хочет не просто создать нечто подобное, а превзойти решение конкурента в 20 раз! Для примера, производительность Tesla M40 достигает 6,8 TFLOPS (FP32). То есть китайский ускоритель должен демонстрировать показатель на уровне 136 TFLOPS!!! Но даже у монструозного Tesla V100 производительность равна «всего» 15 TFLOPS. Как Китай будет решать поставленную задачу, пока совершенно неясно.
С другой стороны, источник говорит о компании Cambricon, у которой уже готовы некие серверные решения, способные заменить ускорители Nvidia. Но при этом пока неизвестно, каков уровень производительности этих решений и с какими продуктами Nvidia их сравнивают.