OpenForum RSS: v4l2 cuda �� GPU

v4l2 cuda �� GPU (fail)

Fri, 08 Jul 2016 11:43:56 GMT

> �� V4L2_MEMORY_USERPTR.
> � �� v4l2 �� (http://www.friendlyarm.net/forum/topic/1006),
> �� , �� malloc, �
> memalign �� malloc.h. �� Invalid argument error 22.

��,
�� memory alignment - �� - ��:

- �� {C,G}PU
- ��

� �� ..

...

v4l2 cuda �� GPU (vsw)

Tue, 05 Jul 2016 20:53:09 GMT

�� V4L2_MEMORY_USERPTR.

� �� v4l2 �� (http://www.friendlyarm.net/forum/topic/1006), �� , �� malloc, � memalign �� malloc.h. �� Invalid argument error 22.

�� IO_METHOD_USERPTR � � init_userp:

unsigned int page_size;

page_size = getpagesize ();
buffer_size = (buffer_size + page_size - 1) & ~(page_size - 1);

..................
..................

for (n_buffers = 0; n_buffers < 4; ++n_buffers) {
buffers[n_buffers].length = buffer_size;
buffers[n_buffers].start = memalign (/* boundary */page_size,buffer_size);

if (!buffers[n_buffers].start) {
fprintf (stderr, "Out of memory\n");
exit (EXIT_FAILURE);
}
}

� �� buf.m.userptr �� buf.length.

�� mmap ��, �� pinn

v4l2 cuda �� GPU (vsw)

Mon, 04 Jul 2016 20:28:48 GMT

�� :

- memcpy from userspace pointer to userspace pointer is about 33ms per 26mb
- memcpy from userspace pointer to pinned pointer is about 33ms per 26mb
- memcpy from mmap v4l pointer to pinned is about 200ms per 26mb

Mmap ��. �� ..

�� : https://devtalk.nvidia.com/default/topic/948258/jetson-tk1/performance-of-v4l2_memory_mmap-buffer-memcpy/

v4l2 cuda �� GPU (vsw)

Sun, 03 Jul 2016 20:10:01 GMT

v4l2_memory_dmabuf �� .

�� MMAP.

�� . �� 70��. �� mp4 ��, �� CUDA �� .

v4l2 cuda �� GPU (vsw)

Mon, 27 Jun 2016 19:21:32 GMT

��. �� . �� .

v4l2 cuda �� GPU (fail_)

Mon, 27 Jun 2016 04:54:30 GMT

> �� V4L2:

https://devtalk.nvidia.com/default/topic/894783/jetson-tk1/v4l2_memory_userptr-not-working-with-soc-camera-/
> IO_METHOD_USERPTR �� . �� MMAP.

��: v4l2_memory_mmap & v4l2_memory_dmabuf
�� -�� ..

v4l2 cuda �� GPU (vsw)

Sun, 26 Jun 2016 22:46:27 GMT

�� V4L2:

https://devtalk.nvidia.com/default/topic/894783/jetson-tk1/v4l2_memory_userptr-not-working-with-soc-camera-/

IO_METHOD_USERPTR �� . �� MMAP.

v4l2 cuda �� GPU (vsw)

Sun, 26 Jun 2016 21:11:57 GMT

�� memcpy �� :

uchar * pIn{ new uchar[ size ]};
uchar * pOut{ new uchar[ size ]};
memcpy( pOut, pIn, size );
delete [] pIn;
delete [] pOut;

�� 200��.

�� , �� Tegra TK1 4224�3156�2 �� .
�� , ��, �� V4L2 ��.
�� .

�� OpenMP, �� 4 �� :

static void memcpy_openmp( uchar * pOut, const uchar * pIn, const int size ) {

//omp_set_dynamic( 0 );
omp_set_num_threads( 4 );
//int blockSize{ 1666368 };
int blockSize{ size / 4 };
int th_id, nthreads;
#pragma omp parallel for
for( int i = 0; i < size / blockSize; i++ ){
int offset{ i * blockSize };
memcpy( pOut + offset, pIn + offset, blockSize );
th_id = omp_get_thread_num();
nthreads = omp_get_num_threads();
qDebug() << th_id << nthreads;
}

}

��-�� 70-80�

v4l2 cuda �� GPU (vsw)

Thu, 23 Jun 2016 19:42:22 GMT

�� .
�� .

OpenForum RSS: v4l2 cuda ��������� ����������� ����� � ������ GPU

v4l2 cuda ��������� ����������� ����� � ������ GPU (fail)

v4l2 cuda ��������� ����������� ����� � ������ GPU (vsw)

v4l2 cuda ��������� ����������� ����� � ������ GPU (vsw)

v4l2 cuda ��������� ����������� ����� � ������ GPU (vsw)

v4l2 cuda ��������� ����������� ����� � ������ GPU (vsw)

v4l2 cuda ��������� ����������� ����� � ������ GPU (fail_)

v4l2 cuda ��������� ����������� ����� � ������ GPU (vsw)

v4l2 cuda ��������� ����������� ����� � ������ GPU (vsw)

v4l2 cuda ��������� ����������� ����� � ������ GPU (vsw)

OpenForum RSS: v4l2 cuda �� GPU

v4l2 cuda �� GPU (fail)

v4l2 cuda �� GPU (vsw)

v4l2 cuda �� GPU (vsw)

v4l2 cuda �� GPU (vsw)

v4l2 cuda �� GPU (vsw)

v4l2 cuda �� GPU (fail_)

v4l2 cuda �� GPU (vsw)

v4l2 cuda �� GPU (vsw)

v4l2 cuda �� GPU (vsw)