Exceeds - Team AI Productivity Dashboard

Vijay Krish

PROFILE

Vijay Krish

Developed and delivered the CK_TILE kernel for GEMM operations in the StreamHPC/rocm-libraries repository, focusing on groupwise quantization of the B tensor to enhance low-precision matrix multiplication. The approach involved loading scale tensors into registers for efficient dequantization and enabling quantization from either A or B operands, increasing flexibility in quantization strategies. New pipelines were implemented using an Intrawave scheduler alongside block GEMM primitives, supporting a range of data-type combinations such as fp8, bf8, and i4. This work leveraged expertise in GPU programming, kernel development, and linear algebra, laying a foundation for broader quantization support in high-performance computing.

PROFILE

Vijay Krish

Same Organization

Shared Repositories

1 Commits • 1 Features

1 Commits • 1 Features

StreamHPC/rocm-libraries

Languages Used

Technical Skills

PROFILE

Vijay Krish

Overall Statistics

Feature vs Bugs

Repository Contributions

Your Network

Same Organization

Shared Repositories

Work History

1 Commits • 1 Features

1 Commits • 1 Features

Activity

Quality Metrics

Skills & Technologies

Programming Languages

Technical Skills

Repositories Contributed To

StreamHPC/rocm-libraries

Languages Used

Technical Skills