/normxcorr/trunk

To get this branch, use:
bzr branch http://suren.me/webbzr/normxcorr/trunk

« back to all changes in this revision

Viewing changes to dict_hw/README

  • Committer: Suren A. Chilingaryan
  • Date: 2010-04-23 00:02:19 UTC
  • Revision ID: csa@dside.dyndns.org-20100423000219-xagi3lp4su6g1y8e
Tags: single_gpu
CUDAfication of real-time module

Show diffs side-by-side

added added

removed removed

Lines of Context:
11
11
    transfer is interleaved with computations. Unfortunatelly, in image mode
12
12
    the memory transfer is handled as computations and there is no interleave
13
13
    is possible. Therefore, in most cases the fragment mode is faster compared
14
 
    to image mode.
 
 
b'\\ No newline at end of file'
 
14
    to image mode.
 
15
 4. We probably can use the same buffer for cuda_base_buffer and cuda_data_buffer,
 
16
    the problem the extra space should be zeroed, and in the base buffer more
 
17
    data is filled. Another option is to unblock computations in load base (3D
 
18
    copy?) and then we would no need it CP_BLOCK times, but just ones.