1ecc0b326SMichel Dänzer /* 2ecc0b326SMichel Dänzer * Copyright 2009 VMware, Inc. 3ecc0b326SMichel Dänzer * 4ecc0b326SMichel Dänzer * Permission is hereby granted, free of charge, to any person obtaining a 5ecc0b326SMichel Dänzer * copy of this software and associated documentation files (the "Software"), 6ecc0b326SMichel Dänzer * to deal in the Software without restriction, including without limitation 7ecc0b326SMichel Dänzer * the rights to use, copy, modify, merge, publish, distribute, sublicense, 8ecc0b326SMichel Dänzer * and/or sell copies of the Software, and to permit persons to whom the 9ecc0b326SMichel Dänzer * Software is furnished to do so, subject to the following conditions: 10ecc0b326SMichel Dänzer * 11ecc0b326SMichel Dänzer * The above copyright notice and this permission notice shall be included in 12ecc0b326SMichel Dänzer * all copies or substantial portions of the Software. 13ecc0b326SMichel Dänzer * 14ecc0b326SMichel Dänzer * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR 15ecc0b326SMichel Dänzer * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, 16ecc0b326SMichel Dänzer * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL 17ecc0b326SMichel Dänzer * THE COPYRIGHT HOLDER(S) OR AUTHOR(S) BE LIABLE FOR ANY CLAIM, DAMAGES OR 18ecc0b326SMichel Dänzer * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, 19ecc0b326SMichel Dänzer * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR 20ecc0b326SMichel Dänzer * OTHER DEALINGS IN THE SOFTWARE. 21ecc0b326SMichel Dänzer * 22ecc0b326SMichel Dänzer * Authors: Michel Dänzer 23ecc0b326SMichel Dänzer */ 24ecc0b326SMichel Dänzer #include <drm/drmP.h> 25ecc0b326SMichel Dänzer #include <drm/radeon_drm.h> 26ecc0b326SMichel Dänzer #include "radeon_reg.h" 27ecc0b326SMichel Dänzer #include "radeon.h" 28ecc0b326SMichel Dänzer 29009ee7a0SAlex Deucher #define RADEON_TEST_COPY_BLIT 1 30009ee7a0SAlex Deucher #define RADEON_TEST_COPY_DMA 0 31009ee7a0SAlex Deucher 32ecc0b326SMichel Dänzer 33ecc0b326SMichel Dänzer /* Test BO GTT->VRAM and VRAM->GTT GPU copies across the whole GTT aperture */ 34009ee7a0SAlex Deucher static void radeon_do_test_moves(struct radeon_device *rdev, int flag) 35ecc0b326SMichel Dänzer { 364c788679SJerome Glisse struct radeon_bo *vram_obj = NULL; 374c788679SJerome Glisse struct radeon_bo **gtt_obj = NULL; 38ecc0b326SMichel Dänzer struct radeon_fence *fence = NULL; 39ecc0b326SMichel Dänzer uint64_t gtt_addr, vram_addr; 40ecc0b326SMichel Dänzer unsigned i, n, size; 41009ee7a0SAlex Deucher int r, ring; 42009ee7a0SAlex Deucher 43009ee7a0SAlex Deucher switch (flag) { 44009ee7a0SAlex Deucher case RADEON_TEST_COPY_DMA: 45009ee7a0SAlex Deucher ring = radeon_copy_dma_ring_index(rdev); 46009ee7a0SAlex Deucher break; 47009ee7a0SAlex Deucher case RADEON_TEST_COPY_BLIT: 48009ee7a0SAlex Deucher ring = radeon_copy_blit_ring_index(rdev); 49009ee7a0SAlex Deucher break; 50009ee7a0SAlex Deucher default: 51009ee7a0SAlex Deucher DRM_ERROR("Unknown copy method\n"); 52009ee7a0SAlex Deucher return; 53009ee7a0SAlex Deucher } 54ecc0b326SMichel Dänzer 55ecc0b326SMichel Dänzer size = 1024 * 1024; 56ecc0b326SMichel Dänzer 57ecc0b326SMichel Dänzer /* Number of tests = 5824cae9e7SMichel Dänzer * (Total GTT - IB pool - writeback page - ring buffers) / test size 59ecc0b326SMichel Dänzer */ 607b1f2485SChristian König n = rdev->mc.gtt_size - RADEON_IB_POOL_SIZE*64*1024; 61bf852799SChristian König for (i = 0; i < RADEON_NUM_RINGS; ++i) 62e32eb50dSChristian König n -= rdev->ring[i].ring_size; 6324cae9e7SMichel Dänzer if (rdev->wb.wb_obj) 6424cae9e7SMichel Dänzer n -= RADEON_GPU_PAGE_SIZE; 6524cae9e7SMichel Dänzer if (rdev->ih.ring_obj) 6624cae9e7SMichel Dänzer n -= rdev->ih.ring_size; 6724cae9e7SMichel Dänzer n /= size; 68ecc0b326SMichel Dänzer 69ecc0b326SMichel Dänzer gtt_obj = kzalloc(n * sizeof(*gtt_obj), GFP_KERNEL); 70ecc0b326SMichel Dänzer if (!gtt_obj) { 71ecc0b326SMichel Dänzer DRM_ERROR("Failed to allocate %d pointers\n", n); 72ecc0b326SMichel Dänzer r = 1; 73ecc0b326SMichel Dänzer goto out_cleanup; 74ecc0b326SMichel Dänzer } 75ecc0b326SMichel Dänzer 76441921d5SDaniel Vetter r = radeon_bo_create(rdev, size, PAGE_SIZE, true, RADEON_GEM_DOMAIN_VRAM, 7740f5cf99SAlex Deucher NULL, &vram_obj); 78ecc0b326SMichel Dänzer if (r) { 79ecc0b326SMichel Dänzer DRM_ERROR("Failed to create VRAM object\n"); 80ecc0b326SMichel Dänzer goto out_cleanup; 81ecc0b326SMichel Dänzer } 824c788679SJerome Glisse r = radeon_bo_reserve(vram_obj, false); 834c788679SJerome Glisse if (unlikely(r != 0)) 844c788679SJerome Glisse goto out_cleanup; 854c788679SJerome Glisse r = radeon_bo_pin(vram_obj, RADEON_GEM_DOMAIN_VRAM, &vram_addr); 86ecc0b326SMichel Dänzer if (r) { 87ecc0b326SMichel Dänzer DRM_ERROR("Failed to pin VRAM object\n"); 88ecc0b326SMichel Dänzer goto out_cleanup; 89ecc0b326SMichel Dänzer } 90ecc0b326SMichel Dänzer for (i = 0; i < n; i++) { 91ecc0b326SMichel Dänzer void *gtt_map, *vram_map; 92ecc0b326SMichel Dänzer void **gtt_start, **gtt_end; 93ecc0b326SMichel Dänzer void **vram_start, **vram_end; 94ecc0b326SMichel Dänzer 95441921d5SDaniel Vetter r = radeon_bo_create(rdev, size, PAGE_SIZE, true, 9640f5cf99SAlex Deucher RADEON_GEM_DOMAIN_GTT, NULL, gtt_obj + i); 97ecc0b326SMichel Dänzer if (r) { 98ecc0b326SMichel Dänzer DRM_ERROR("Failed to create GTT object %d\n", i); 99ecc0b326SMichel Dänzer goto out_cleanup; 100ecc0b326SMichel Dänzer } 101ecc0b326SMichel Dänzer 1024c788679SJerome Glisse r = radeon_bo_reserve(gtt_obj[i], false); 1034c788679SJerome Glisse if (unlikely(r != 0)) 1044c788679SJerome Glisse goto out_cleanup; 1054c788679SJerome Glisse r = radeon_bo_pin(gtt_obj[i], RADEON_GEM_DOMAIN_GTT, >t_addr); 106ecc0b326SMichel Dänzer if (r) { 107ecc0b326SMichel Dänzer DRM_ERROR("Failed to pin GTT object %d\n", i); 108ecc0b326SMichel Dänzer goto out_cleanup; 109ecc0b326SMichel Dänzer } 110ecc0b326SMichel Dänzer 1114c788679SJerome Glisse r = radeon_bo_kmap(gtt_obj[i], >t_map); 112ecc0b326SMichel Dänzer if (r) { 113ecc0b326SMichel Dänzer DRM_ERROR("Failed to map GTT object %d\n", i); 114ecc0b326SMichel Dänzer goto out_cleanup; 115ecc0b326SMichel Dänzer } 116ecc0b326SMichel Dänzer 117ecc0b326SMichel Dänzer for (gtt_start = gtt_map, gtt_end = gtt_map + size; 118ecc0b326SMichel Dänzer gtt_start < gtt_end; 119ecc0b326SMichel Dänzer gtt_start++) 120ecc0b326SMichel Dänzer *gtt_start = gtt_start; 121ecc0b326SMichel Dänzer 1224c788679SJerome Glisse radeon_bo_kunmap(gtt_obj[i]); 123ecc0b326SMichel Dänzer 124009ee7a0SAlex Deucher if (ring == R600_RING_TYPE_DMA_INDEX) 125009ee7a0SAlex Deucher r = radeon_copy_dma(rdev, gtt_addr, vram_addr, size / RADEON_GPU_PAGE_SIZE, &fence); 126009ee7a0SAlex Deucher else 127009ee7a0SAlex Deucher r = radeon_copy_blit(rdev, gtt_addr, vram_addr, size / RADEON_GPU_PAGE_SIZE, &fence); 128ecc0b326SMichel Dänzer if (r) { 129ecc0b326SMichel Dänzer DRM_ERROR("Failed GTT->VRAM copy %d\n", i); 130ecc0b326SMichel Dänzer goto out_cleanup; 131ecc0b326SMichel Dänzer } 132ecc0b326SMichel Dänzer 133ecc0b326SMichel Dänzer r = radeon_fence_wait(fence, false); 134ecc0b326SMichel Dänzer if (r) { 135ecc0b326SMichel Dänzer DRM_ERROR("Failed to wait for GTT->VRAM fence %d\n", i); 136ecc0b326SMichel Dänzer goto out_cleanup; 137ecc0b326SMichel Dänzer } 138ecc0b326SMichel Dänzer 139ecc0b326SMichel Dänzer radeon_fence_unref(&fence); 140ecc0b326SMichel Dänzer 1414c788679SJerome Glisse r = radeon_bo_kmap(vram_obj, &vram_map); 142ecc0b326SMichel Dänzer if (r) { 143ecc0b326SMichel Dänzer DRM_ERROR("Failed to map VRAM object after copy %d\n", i); 144ecc0b326SMichel Dänzer goto out_cleanup; 145ecc0b326SMichel Dänzer } 146ecc0b326SMichel Dänzer 147ecc0b326SMichel Dänzer for (gtt_start = gtt_map, gtt_end = gtt_map + size, 148ecc0b326SMichel Dänzer vram_start = vram_map, vram_end = vram_map + size; 149ecc0b326SMichel Dänzer vram_start < vram_end; 150ecc0b326SMichel Dänzer gtt_start++, vram_start++) { 151ecc0b326SMichel Dänzer if (*vram_start != gtt_start) { 152ecc0b326SMichel Dänzer DRM_ERROR("Incorrect GTT->VRAM copy %d: Got 0x%p, " 1534fb1a35cSMichel Dänzer "expected 0x%p (GTT/VRAM offset " 1544fb1a35cSMichel Dänzer "0x%16llx/0x%16llx)\n", 1554fb1a35cSMichel Dänzer i, *vram_start, gtt_start, 1564fb1a35cSMichel Dänzer (unsigned long long) 1574fb1a35cSMichel Dänzer (gtt_addr - rdev->mc.gtt_start + 1584fb1a35cSMichel Dänzer (void*)gtt_start - gtt_map), 1594fb1a35cSMichel Dänzer (unsigned long long) 1604fb1a35cSMichel Dänzer (vram_addr - rdev->mc.vram_start + 1614fb1a35cSMichel Dänzer (void*)gtt_start - gtt_map)); 1624c788679SJerome Glisse radeon_bo_kunmap(vram_obj); 163ecc0b326SMichel Dänzer goto out_cleanup; 164ecc0b326SMichel Dänzer } 165ecc0b326SMichel Dänzer *vram_start = vram_start; 166ecc0b326SMichel Dänzer } 167ecc0b326SMichel Dänzer 1684c788679SJerome Glisse radeon_bo_kunmap(vram_obj); 169ecc0b326SMichel Dänzer 170009ee7a0SAlex Deucher if (ring == R600_RING_TYPE_DMA_INDEX) 171009ee7a0SAlex Deucher r = radeon_copy_dma(rdev, vram_addr, gtt_addr, size / RADEON_GPU_PAGE_SIZE, &fence); 172009ee7a0SAlex Deucher else 173009ee7a0SAlex Deucher r = radeon_copy_blit(rdev, vram_addr, gtt_addr, size / RADEON_GPU_PAGE_SIZE, &fence); 174ecc0b326SMichel Dänzer if (r) { 175ecc0b326SMichel Dänzer DRM_ERROR("Failed VRAM->GTT copy %d\n", i); 176ecc0b326SMichel Dänzer goto out_cleanup; 177ecc0b326SMichel Dänzer } 178ecc0b326SMichel Dänzer 179ecc0b326SMichel Dänzer r = radeon_fence_wait(fence, false); 180ecc0b326SMichel Dänzer if (r) { 181ecc0b326SMichel Dänzer DRM_ERROR("Failed to wait for VRAM->GTT fence %d\n", i); 182ecc0b326SMichel Dänzer goto out_cleanup; 183ecc0b326SMichel Dänzer } 184ecc0b326SMichel Dänzer 185ecc0b326SMichel Dänzer radeon_fence_unref(&fence); 186ecc0b326SMichel Dänzer 1874c788679SJerome Glisse r = radeon_bo_kmap(gtt_obj[i], >t_map); 188ecc0b326SMichel Dänzer if (r) { 189ecc0b326SMichel Dänzer DRM_ERROR("Failed to map GTT object after copy %d\n", i); 190ecc0b326SMichel Dänzer goto out_cleanup; 191ecc0b326SMichel Dänzer } 192ecc0b326SMichel Dänzer 193ecc0b326SMichel Dänzer for (gtt_start = gtt_map, gtt_end = gtt_map + size, 194ecc0b326SMichel Dänzer vram_start = vram_map, vram_end = vram_map + size; 195ecc0b326SMichel Dänzer gtt_start < gtt_end; 196ecc0b326SMichel Dänzer gtt_start++, vram_start++) { 197ecc0b326SMichel Dänzer if (*gtt_start != vram_start) { 198ecc0b326SMichel Dänzer DRM_ERROR("Incorrect VRAM->GTT copy %d: Got 0x%p, " 1994fb1a35cSMichel Dänzer "expected 0x%p (VRAM/GTT offset " 2004fb1a35cSMichel Dänzer "0x%16llx/0x%16llx)\n", 2014fb1a35cSMichel Dänzer i, *gtt_start, vram_start, 2024fb1a35cSMichel Dänzer (unsigned long long) 2034fb1a35cSMichel Dänzer (vram_addr - rdev->mc.vram_start + 2044fb1a35cSMichel Dänzer (void*)vram_start - vram_map), 2054fb1a35cSMichel Dänzer (unsigned long long) 2064fb1a35cSMichel Dänzer (gtt_addr - rdev->mc.gtt_start + 2074fb1a35cSMichel Dänzer (void*)vram_start - vram_map)); 2084c788679SJerome Glisse radeon_bo_kunmap(gtt_obj[i]); 209ecc0b326SMichel Dänzer goto out_cleanup; 210ecc0b326SMichel Dänzer } 211ecc0b326SMichel Dänzer } 212ecc0b326SMichel Dänzer 2134c788679SJerome Glisse radeon_bo_kunmap(gtt_obj[i]); 214ecc0b326SMichel Dänzer 215ecc0b326SMichel Dänzer DRM_INFO("Tested GTT->VRAM and VRAM->GTT copy for GTT offset 0x%llx\n", 216d594e46aSJerome Glisse gtt_addr - rdev->mc.gtt_start); 217ecc0b326SMichel Dänzer } 218ecc0b326SMichel Dänzer 219ecc0b326SMichel Dänzer out_cleanup: 220ecc0b326SMichel Dänzer if (vram_obj) { 2214c788679SJerome Glisse if (radeon_bo_is_reserved(vram_obj)) { 2224c788679SJerome Glisse radeon_bo_unpin(vram_obj); 2234c788679SJerome Glisse radeon_bo_unreserve(vram_obj); 2244c788679SJerome Glisse } 2254c788679SJerome Glisse radeon_bo_unref(&vram_obj); 226ecc0b326SMichel Dänzer } 227ecc0b326SMichel Dänzer if (gtt_obj) { 228ecc0b326SMichel Dänzer for (i = 0; i < n; i++) { 229ecc0b326SMichel Dänzer if (gtt_obj[i]) { 2304c788679SJerome Glisse if (radeon_bo_is_reserved(gtt_obj[i])) { 2314c788679SJerome Glisse radeon_bo_unpin(gtt_obj[i]); 2324c788679SJerome Glisse radeon_bo_unreserve(gtt_obj[i]); 2334c788679SJerome Glisse } 2344c788679SJerome Glisse radeon_bo_unref(>t_obj[i]); 235ecc0b326SMichel Dänzer } 236ecc0b326SMichel Dänzer } 237ecc0b326SMichel Dänzer kfree(gtt_obj); 238ecc0b326SMichel Dänzer } 239ecc0b326SMichel Dänzer if (fence) { 240ecc0b326SMichel Dänzer radeon_fence_unref(&fence); 241ecc0b326SMichel Dänzer } 242ecc0b326SMichel Dänzer if (r) { 243ecc0b326SMichel Dänzer printk(KERN_WARNING "Error while testing BO move.\n"); 244ecc0b326SMichel Dänzer } 245ecc0b326SMichel Dänzer } 24660a7e396SChristian König 247009ee7a0SAlex Deucher void radeon_test_moves(struct radeon_device *rdev) 248009ee7a0SAlex Deucher { 249009ee7a0SAlex Deucher if (rdev->asic->copy.dma) 250009ee7a0SAlex Deucher radeon_do_test_moves(rdev, RADEON_TEST_COPY_DMA); 251009ee7a0SAlex Deucher if (rdev->asic->copy.blit) 252009ee7a0SAlex Deucher radeon_do_test_moves(rdev, RADEON_TEST_COPY_BLIT); 253009ee7a0SAlex Deucher } 254009ee7a0SAlex Deucher 255*f2ba57b5SChristian König static int radeon_test_create_and_emit_fence(struct radeon_device *rdev, 256*f2ba57b5SChristian König struct radeon_ring *ring, 257*f2ba57b5SChristian König struct radeon_fence **fence) 258*f2ba57b5SChristian König { 259*f2ba57b5SChristian König int r; 260*f2ba57b5SChristian König 261*f2ba57b5SChristian König if (ring->idx == R600_RING_TYPE_UVD_INDEX) { 262*f2ba57b5SChristian König r = radeon_uvd_get_create_msg(rdev, ring->idx, 1, NULL); 263*f2ba57b5SChristian König if (r) { 264*f2ba57b5SChristian König DRM_ERROR("Failed to get dummy create msg\n"); 265*f2ba57b5SChristian König return r; 266*f2ba57b5SChristian König } 267*f2ba57b5SChristian König 268*f2ba57b5SChristian König r = radeon_uvd_get_destroy_msg(rdev, ring->idx, 1, fence); 269*f2ba57b5SChristian König if (r) { 270*f2ba57b5SChristian König DRM_ERROR("Failed to get dummy destroy msg\n"); 271*f2ba57b5SChristian König return r; 272*f2ba57b5SChristian König } 273*f2ba57b5SChristian König } else { 274*f2ba57b5SChristian König r = radeon_ring_lock(rdev, ring, 64); 275*f2ba57b5SChristian König if (r) { 276*f2ba57b5SChristian König DRM_ERROR("Failed to lock ring A %d\n", ring->idx); 277*f2ba57b5SChristian König return r; 278*f2ba57b5SChristian König } 279*f2ba57b5SChristian König radeon_fence_emit(rdev, fence, ring->idx); 280*f2ba57b5SChristian König radeon_ring_unlock_commit(rdev, ring); 281*f2ba57b5SChristian König } 282*f2ba57b5SChristian König return 0; 283*f2ba57b5SChristian König } 284*f2ba57b5SChristian König 28560a7e396SChristian König void radeon_test_ring_sync(struct radeon_device *rdev, 286e32eb50dSChristian König struct radeon_ring *ringA, 287e32eb50dSChristian König struct radeon_ring *ringB) 28860a7e396SChristian König { 289ce954884SChristian König struct radeon_fence *fence1 = NULL, *fence2 = NULL; 29060a7e396SChristian König struct radeon_semaphore *semaphore = NULL; 29160a7e396SChristian König int r; 29260a7e396SChristian König 29360a7e396SChristian König r = radeon_semaphore_create(rdev, &semaphore); 29460a7e396SChristian König if (r) { 29560a7e396SChristian König DRM_ERROR("Failed to create semaphore\n"); 29660a7e396SChristian König goto out_cleanup; 29760a7e396SChristian König } 29860a7e396SChristian König 299e32eb50dSChristian König r = radeon_ring_lock(rdev, ringA, 64); 30060a7e396SChristian König if (r) { 3018b25ed34SAlex Deucher DRM_ERROR("Failed to lock ring A %d\n", ringA->idx); 30260a7e396SChristian König goto out_cleanup; 30360a7e396SChristian König } 3048b25ed34SAlex Deucher radeon_semaphore_emit_wait(rdev, ringA->idx, semaphore); 305*f2ba57b5SChristian König radeon_ring_unlock_commit(rdev, ringA); 306*f2ba57b5SChristian König 307*f2ba57b5SChristian König r = radeon_test_create_and_emit_fence(rdev, ringA, &fence1); 308*f2ba57b5SChristian König if (r) 309*f2ba57b5SChristian König goto out_cleanup; 310*f2ba57b5SChristian König 311*f2ba57b5SChristian König r = radeon_ring_lock(rdev, ringA, 64); 312876dc9f3SChristian König if (r) { 313*f2ba57b5SChristian König DRM_ERROR("Failed to lock ring A %d\n", ringA->idx); 314876dc9f3SChristian König goto out_cleanup; 315876dc9f3SChristian König } 3168b25ed34SAlex Deucher radeon_semaphore_emit_wait(rdev, ringA->idx, semaphore); 317e32eb50dSChristian König radeon_ring_unlock_commit(rdev, ringA); 31860a7e396SChristian König 319*f2ba57b5SChristian König r = radeon_test_create_and_emit_fence(rdev, ringA, &fence2); 320*f2ba57b5SChristian König if (r) 321*f2ba57b5SChristian König goto out_cleanup; 322*f2ba57b5SChristian König 32360a7e396SChristian König mdelay(1000); 32460a7e396SChristian König 325ce954884SChristian König if (radeon_fence_signaled(fence1)) { 326ce954884SChristian König DRM_ERROR("Fence 1 signaled without waiting for semaphore.\n"); 32760a7e396SChristian König goto out_cleanup; 32860a7e396SChristian König } 32960a7e396SChristian König 330e32eb50dSChristian König r = radeon_ring_lock(rdev, ringB, 64); 33160a7e396SChristian König if (r) { 332e32eb50dSChristian König DRM_ERROR("Failed to lock ring B %p\n", ringB); 33360a7e396SChristian König goto out_cleanup; 33460a7e396SChristian König } 3358b25ed34SAlex Deucher radeon_semaphore_emit_signal(rdev, ringB->idx, semaphore); 336e32eb50dSChristian König radeon_ring_unlock_commit(rdev, ringB); 33760a7e396SChristian König 338ce954884SChristian König r = radeon_fence_wait(fence1, false); 33960a7e396SChristian König if (r) { 340ce954884SChristian König DRM_ERROR("Failed to wait for sync fence 1\n"); 34160a7e396SChristian König goto out_cleanup; 34260a7e396SChristian König } 34360a7e396SChristian König 344ce954884SChristian König mdelay(1000); 345ce954884SChristian König 346ce954884SChristian König if (radeon_fence_signaled(fence2)) { 347ce954884SChristian König DRM_ERROR("Fence 2 signaled without waiting for semaphore.\n"); 348ce954884SChristian König goto out_cleanup; 349ce954884SChristian König } 350ce954884SChristian König 351ce954884SChristian König r = radeon_ring_lock(rdev, ringB, 64); 352ce954884SChristian König if (r) { 353ce954884SChristian König DRM_ERROR("Failed to lock ring B %p\n", ringB); 354ce954884SChristian König goto out_cleanup; 355ce954884SChristian König } 3568b25ed34SAlex Deucher radeon_semaphore_emit_signal(rdev, ringB->idx, semaphore); 357ce954884SChristian König radeon_ring_unlock_commit(rdev, ringB); 358ce954884SChristian König 359ce954884SChristian König r = radeon_fence_wait(fence2, false); 360ce954884SChristian König if (r) { 361ce954884SChristian König DRM_ERROR("Failed to wait for sync fence 1\n"); 362ce954884SChristian König goto out_cleanup; 363ce954884SChristian König } 36460a7e396SChristian König 36560a7e396SChristian König out_cleanup: 366220907d9SChristian König radeon_semaphore_free(rdev, &semaphore, NULL); 36760a7e396SChristian König 368ce954884SChristian König if (fence1) 369ce954884SChristian König radeon_fence_unref(&fence1); 370ce954884SChristian König 371ce954884SChristian König if (fence2) 372ce954884SChristian König radeon_fence_unref(&fence2); 373ce954884SChristian König 374ce954884SChristian König if (r) 375ce954884SChristian König printk(KERN_WARNING "Error while testing ring sync (%d).\n", r); 376ce954884SChristian König } 377ce954884SChristian König 3781109ca09SLauri Kasanen static void radeon_test_ring_sync2(struct radeon_device *rdev, 379ce954884SChristian König struct radeon_ring *ringA, 380ce954884SChristian König struct radeon_ring *ringB, 381ce954884SChristian König struct radeon_ring *ringC) 382ce954884SChristian König { 383ce954884SChristian König struct radeon_fence *fenceA = NULL, *fenceB = NULL; 384ce954884SChristian König struct radeon_semaphore *semaphore = NULL; 385ce954884SChristian König bool sigA, sigB; 386ce954884SChristian König int i, r; 387ce954884SChristian König 388ce954884SChristian König r = radeon_semaphore_create(rdev, &semaphore); 389ce954884SChristian König if (r) { 390ce954884SChristian König DRM_ERROR("Failed to create semaphore\n"); 391ce954884SChristian König goto out_cleanup; 392ce954884SChristian König } 393ce954884SChristian König 394ce954884SChristian König r = radeon_ring_lock(rdev, ringA, 64); 395ce954884SChristian König if (r) { 3968b25ed34SAlex Deucher DRM_ERROR("Failed to lock ring A %d\n", ringA->idx); 397ce954884SChristian König goto out_cleanup; 398ce954884SChristian König } 3998b25ed34SAlex Deucher radeon_semaphore_emit_wait(rdev, ringA->idx, semaphore); 400ce954884SChristian König radeon_ring_unlock_commit(rdev, ringA); 401ce954884SChristian König 402*f2ba57b5SChristian König r = radeon_test_create_and_emit_fence(rdev, ringA, &fenceA); 403*f2ba57b5SChristian König if (r) 404*f2ba57b5SChristian König goto out_cleanup; 405*f2ba57b5SChristian König 406ce954884SChristian König r = radeon_ring_lock(rdev, ringB, 64); 407ce954884SChristian König if (r) { 4088b25ed34SAlex Deucher DRM_ERROR("Failed to lock ring B %d\n", ringB->idx); 409ce954884SChristian König goto out_cleanup; 410ce954884SChristian König } 4118b25ed34SAlex Deucher radeon_semaphore_emit_wait(rdev, ringB->idx, semaphore); 412ce954884SChristian König radeon_ring_unlock_commit(rdev, ringB); 413*f2ba57b5SChristian König r = radeon_test_create_and_emit_fence(rdev, ringB, &fenceB); 414*f2ba57b5SChristian König if (r) 415*f2ba57b5SChristian König goto out_cleanup; 416ce954884SChristian König 417ce954884SChristian König mdelay(1000); 418ce954884SChristian König 419ce954884SChristian König if (radeon_fence_signaled(fenceA)) { 420ce954884SChristian König DRM_ERROR("Fence A signaled without waiting for semaphore.\n"); 421ce954884SChristian König goto out_cleanup; 422ce954884SChristian König } 423ce954884SChristian König if (radeon_fence_signaled(fenceB)) { 424*f2ba57b5SChristian König DRM_ERROR("Fence B signaled without waiting for semaphore.\n"); 425ce954884SChristian König goto out_cleanup; 426ce954884SChristian König } 427ce954884SChristian König 428ce954884SChristian König r = radeon_ring_lock(rdev, ringC, 64); 429ce954884SChristian König if (r) { 430ce954884SChristian König DRM_ERROR("Failed to lock ring B %p\n", ringC); 431ce954884SChristian König goto out_cleanup; 432ce954884SChristian König } 4338b25ed34SAlex Deucher radeon_semaphore_emit_signal(rdev, ringC->idx, semaphore); 434ce954884SChristian König radeon_ring_unlock_commit(rdev, ringC); 435ce954884SChristian König 436ce954884SChristian König for (i = 0; i < 30; ++i) { 437ce954884SChristian König mdelay(100); 438ce954884SChristian König sigA = radeon_fence_signaled(fenceA); 439ce954884SChristian König sigB = radeon_fence_signaled(fenceB); 440ce954884SChristian König if (sigA || sigB) 441ce954884SChristian König break; 442ce954884SChristian König } 443ce954884SChristian König 444ce954884SChristian König if (!sigA && !sigB) { 445ce954884SChristian König DRM_ERROR("Neither fence A nor B has been signaled\n"); 446ce954884SChristian König goto out_cleanup; 447ce954884SChristian König } else if (sigA && sigB) { 448ce954884SChristian König DRM_ERROR("Both fence A and B has been signaled\n"); 449ce954884SChristian König goto out_cleanup; 450ce954884SChristian König } 451ce954884SChristian König 452ce954884SChristian König DRM_INFO("Fence %c was first signaled\n", sigA ? 'A' : 'B'); 453ce954884SChristian König 454ce954884SChristian König r = radeon_ring_lock(rdev, ringC, 64); 455ce954884SChristian König if (r) { 456ce954884SChristian König DRM_ERROR("Failed to lock ring B %p\n", ringC); 457ce954884SChristian König goto out_cleanup; 458ce954884SChristian König } 4598b25ed34SAlex Deucher radeon_semaphore_emit_signal(rdev, ringC->idx, semaphore); 460ce954884SChristian König radeon_ring_unlock_commit(rdev, ringC); 461ce954884SChristian König 462ce954884SChristian König mdelay(1000); 463ce954884SChristian König 464ce954884SChristian König r = radeon_fence_wait(fenceA, false); 465ce954884SChristian König if (r) { 466ce954884SChristian König DRM_ERROR("Failed to wait for sync fence A\n"); 467ce954884SChristian König goto out_cleanup; 468ce954884SChristian König } 469ce954884SChristian König r = radeon_fence_wait(fenceB, false); 470ce954884SChristian König if (r) { 471ce954884SChristian König DRM_ERROR("Failed to wait for sync fence B\n"); 472ce954884SChristian König goto out_cleanup; 473ce954884SChristian König } 474ce954884SChristian König 475ce954884SChristian König out_cleanup: 476220907d9SChristian König radeon_semaphore_free(rdev, &semaphore, NULL); 477ce954884SChristian König 478ce954884SChristian König if (fenceA) 479ce954884SChristian König radeon_fence_unref(&fenceA); 480ce954884SChristian König 481ce954884SChristian König if (fenceB) 482ce954884SChristian König radeon_fence_unref(&fenceB); 48360a7e396SChristian König 48460a7e396SChristian König if (r) 48560a7e396SChristian König printk(KERN_WARNING "Error while testing ring sync (%d).\n", r); 48660a7e396SChristian König } 48760a7e396SChristian König 48860a7e396SChristian König void radeon_test_syncing(struct radeon_device *rdev) 48960a7e396SChristian König { 490ce954884SChristian König int i, j, k; 49160a7e396SChristian König 49260a7e396SChristian König for (i = 1; i < RADEON_NUM_RINGS; ++i) { 493e32eb50dSChristian König struct radeon_ring *ringA = &rdev->ring[i]; 494e32eb50dSChristian König if (!ringA->ready) 49560a7e396SChristian König continue; 49660a7e396SChristian König 49760a7e396SChristian König for (j = 0; j < i; ++j) { 498e32eb50dSChristian König struct radeon_ring *ringB = &rdev->ring[j]; 499e32eb50dSChristian König if (!ringB->ready) 50060a7e396SChristian König continue; 50160a7e396SChristian König 502ce954884SChristian König DRM_INFO("Testing syncing between rings %d and %d...\n", i, j); 503e32eb50dSChristian König radeon_test_ring_sync(rdev, ringA, ringB); 50460a7e396SChristian König 505ce954884SChristian König DRM_INFO("Testing syncing between rings %d and %d...\n", j, i); 506e32eb50dSChristian König radeon_test_ring_sync(rdev, ringB, ringA); 507ce954884SChristian König 508ce954884SChristian König for (k = 0; k < j; ++k) { 509ce954884SChristian König struct radeon_ring *ringC = &rdev->ring[k]; 5101f2e124dSAlex Deucher if (!ringC->ready) 5111f2e124dSAlex Deucher continue; 512ce954884SChristian König 513ce954884SChristian König DRM_INFO("Testing syncing between rings %d, %d and %d...\n", i, j, k); 514ce954884SChristian König radeon_test_ring_sync2(rdev, ringA, ringB, ringC); 515ce954884SChristian König 516ce954884SChristian König DRM_INFO("Testing syncing between rings %d, %d and %d...\n", i, k, j); 517ce954884SChristian König radeon_test_ring_sync2(rdev, ringA, ringC, ringB); 518ce954884SChristian König 519ce954884SChristian König DRM_INFO("Testing syncing between rings %d, %d and %d...\n", j, i, k); 520ce954884SChristian König radeon_test_ring_sync2(rdev, ringB, ringA, ringC); 521ce954884SChristian König 522ce954884SChristian König DRM_INFO("Testing syncing between rings %d, %d and %d...\n", j, k, i); 523ce954884SChristian König radeon_test_ring_sync2(rdev, ringB, ringC, ringA); 524ce954884SChristian König 525ce954884SChristian König DRM_INFO("Testing syncing between rings %d, %d and %d...\n", k, i, j); 526ce954884SChristian König radeon_test_ring_sync2(rdev, ringC, ringA, ringB); 527ce954884SChristian König 528ce954884SChristian König DRM_INFO("Testing syncing between rings %d, %d and %d...\n", k, j, i); 529ce954884SChristian König radeon_test_ring_sync2(rdev, ringC, ringB, ringA); 530ce954884SChristian König } 53160a7e396SChristian König } 53260a7e396SChristian König } 53360a7e396SChristian König } 534