Thứ Ba, 1 tháng 6, 2010

Dùng CUDA template

Mình đang bị vấn đề với cài đặt Harris Laplace detector trên C. Do sử dụng kernel với kích thước lớn nên dẫn tới convolution tốn rất nhiều thơi gian.
Thế thử cài convolution trực tiếp trên CUDA, kết quả tương đối khả quan (nhanh 13 lần :D) nhưng vẫn chậm hơn so với của người ta 100 lần :( . Convolution trên miền tần số thì lại bị sai số.
Thế là thử dùng cái cuFFT trong CUDA template xem thế nào.
Mình tạo project mới và insert mấy file source code vào nhưng không compile được do CUDA project cấu hình cái quỷ gì đó mà mình không tài nào chỉnh đúng.
Đang đuối thì vớ được tài liệu này . Giải pháp là copy cái template nó ra rồi chỉnh lại tương ứng thôi compile lại --> Thế mà mình không nghĩ ra . Ngốc thật :(

Không có nhận xét nào:

Đăng nhận xét