1d93f7937SChristian König /* 2d93f7937SChristian König * Copyright 2013 Advanced Micro Devices, Inc. 3d93f7937SChristian König * All Rights Reserved. 4d93f7937SChristian König * 5d93f7937SChristian König * Permission is hereby granted, free of charge, to any person obtaining a 6d93f7937SChristian König * copy of this software and associated documentation files (the 7d93f7937SChristian König * "Software"), to deal in the Software without restriction, including 8d93f7937SChristian König * without limitation the rights to use, copy, modify, merge, publish, 9d93f7937SChristian König * distribute, sub license, and/or sell copies of the Software, and to 10d93f7937SChristian König * permit persons to whom the Software is furnished to do so, subject to 11d93f7937SChristian König * the following conditions: 12d93f7937SChristian König * 13d93f7937SChristian König * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR 14d93f7937SChristian König * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, 15d93f7937SChristian König * FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL 16d93f7937SChristian König * THE COPYRIGHT HOLDERS, AUTHORS AND/OR ITS SUPPLIERS BE LIABLE FOR ANY CLAIM, 17d93f7937SChristian König * DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR 18d93f7937SChristian König * OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE 19d93f7937SChristian König * USE OR OTHER DEALINGS IN THE SOFTWARE. 20d93f7937SChristian König * 21d93f7937SChristian König * The above copyright notice and this permission notice (including the 22d93f7937SChristian König * next paragraph) shall be included in all copies or substantial portions 23d93f7937SChristian König * of the Software. 24d93f7937SChristian König * 25d93f7937SChristian König * Authors: Christian König <christian.koenig@amd.com> 26d93f7937SChristian König */ 27d93f7937SChristian König 28d93f7937SChristian König #include <linux/firmware.h> 29d93f7937SChristian König #include <linux/module.h> 30d93f7937SChristian König #include <drm/drmP.h> 31d93f7937SChristian König #include <drm/drm.h> 32d93f7937SChristian König 33d93f7937SChristian König #include "radeon.h" 34d93f7937SChristian König #include "radeon_asic.h" 35d93f7937SChristian König #include "sid.h" 36d93f7937SChristian König 37*03afe6f6SAlex Deucher /* 1 second timeout */ 38*03afe6f6SAlex Deucher #define VCE_IDLE_TIMEOUT_MS 1000 39*03afe6f6SAlex Deucher 40d93f7937SChristian König /* Firmware Names */ 41d93f7937SChristian König #define FIRMWARE_BONAIRE "radeon/BONAIRE_vce.bin" 42d93f7937SChristian König 43d93f7937SChristian König MODULE_FIRMWARE(FIRMWARE_BONAIRE); 44d93f7937SChristian König 45*03afe6f6SAlex Deucher static void radeon_vce_idle_work_handler(struct work_struct *work); 46*03afe6f6SAlex Deucher 47d93f7937SChristian König /** 48d93f7937SChristian König * radeon_vce_init - allocate memory, load vce firmware 49d93f7937SChristian König * 50d93f7937SChristian König * @rdev: radeon_device pointer 51d93f7937SChristian König * 52d93f7937SChristian König * First step to get VCE online, allocate memory and load the firmware 53d93f7937SChristian König */ 54d93f7937SChristian König int radeon_vce_init(struct radeon_device *rdev) 55d93f7937SChristian König { 5698ccc291SChristian König static const char *fw_version = "[ATI LIB=VCEFW,"; 5798ccc291SChristian König static const char *fb_version = "[ATI LIB=VCEFWSTATS,"; 5898ccc291SChristian König unsigned long size; 5998ccc291SChristian König const char *fw_name, *c; 6098ccc291SChristian König uint8_t start, mid, end; 61d93f7937SChristian König int i, r; 62d93f7937SChristian König 63*03afe6f6SAlex Deucher INIT_DELAYED_WORK(&rdev->vce.idle_work, radeon_vce_idle_work_handler); 64*03afe6f6SAlex Deucher 65d93f7937SChristian König switch (rdev->family) { 66d93f7937SChristian König case CHIP_BONAIRE: 67d93f7937SChristian König case CHIP_KAVERI: 68d93f7937SChristian König case CHIP_KABINI: 69d93f7937SChristian König fw_name = FIRMWARE_BONAIRE; 70d93f7937SChristian König break; 71d93f7937SChristian König 72d93f7937SChristian König default: 73d93f7937SChristian König return -EINVAL; 74d93f7937SChristian König } 75d93f7937SChristian König 76d93f7937SChristian König r = request_firmware(&rdev->vce_fw, fw_name, rdev->dev); 77d93f7937SChristian König if (r) { 78d93f7937SChristian König dev_err(rdev->dev, "radeon_vce: Can't load firmware \"%s\"\n", 79d93f7937SChristian König fw_name); 80d93f7937SChristian König return r; 81d93f7937SChristian König } 82d93f7937SChristian König 8398ccc291SChristian König /* search for firmware version */ 8498ccc291SChristian König 8598ccc291SChristian König size = rdev->vce_fw->size - strlen(fw_version) - 9; 8698ccc291SChristian König c = rdev->vce_fw->data; 8798ccc291SChristian König for (;size > 0; --size, ++c) 8898ccc291SChristian König if (strncmp(c, fw_version, strlen(fw_version)) == 0) 8998ccc291SChristian König break; 9098ccc291SChristian König 9198ccc291SChristian König if (size == 0) 9298ccc291SChristian König return -EINVAL; 9398ccc291SChristian König 9498ccc291SChristian König c += strlen(fw_version); 9598ccc291SChristian König if (sscanf(c, "%2hhd.%2hhd.%2hhd]", &start, &mid, &end) != 3) 9698ccc291SChristian König return -EINVAL; 9798ccc291SChristian König 9898ccc291SChristian König /* search for feedback version */ 9998ccc291SChristian König 10098ccc291SChristian König size = rdev->vce_fw->size - strlen(fb_version) - 3; 10198ccc291SChristian König c = rdev->vce_fw->data; 10298ccc291SChristian König for (;size > 0; --size, ++c) 10398ccc291SChristian König if (strncmp(c, fb_version, strlen(fb_version)) == 0) 10498ccc291SChristian König break; 10598ccc291SChristian König 10698ccc291SChristian König if (size == 0) 10798ccc291SChristian König return -EINVAL; 10898ccc291SChristian König 10998ccc291SChristian König c += strlen(fb_version); 11098ccc291SChristian König if (sscanf(c, "%2u]", &rdev->vce.fb_version) != 1) 11198ccc291SChristian König return -EINVAL; 11298ccc291SChristian König 11398ccc291SChristian König DRM_INFO("Found VCE firmware/feedback version %hhd.%hhd.%hhd / %d!\n", 11498ccc291SChristian König start, mid, end, rdev->vce.fb_version); 11598ccc291SChristian König 11698ccc291SChristian König rdev->vce.fw_version = (start << 24) | (mid << 16) | (end << 8); 11798ccc291SChristian König 11898ccc291SChristian König /* we can only work with this fw version for now */ 11998ccc291SChristian König if (rdev->vce.fw_version != ((40 << 24) | (2 << 16) | (2 << 8))) 12098ccc291SChristian König return -EINVAL; 12198ccc291SChristian König 12298ccc291SChristian König /* load firmware into VRAM */ 12398ccc291SChristian König 12498ccc291SChristian König size = RADEON_GPU_PAGE_ALIGN(rdev->vce_fw->size) + 125d93f7937SChristian König RADEON_VCE_STACK_SIZE + RADEON_VCE_HEAP_SIZE; 12698ccc291SChristian König r = radeon_bo_create(rdev, size, PAGE_SIZE, true, 127d93f7937SChristian König RADEON_GEM_DOMAIN_VRAM, NULL, &rdev->vce.vcpu_bo); 128d93f7937SChristian König if (r) { 129d93f7937SChristian König dev_err(rdev->dev, "(%d) failed to allocate VCE bo\n", r); 130d93f7937SChristian König return r; 131d93f7937SChristian König } 132d93f7937SChristian König 133d93f7937SChristian König r = radeon_vce_resume(rdev); 134d93f7937SChristian König if (r) 135d93f7937SChristian König return r; 136d93f7937SChristian König 13798ccc291SChristian König memset(rdev->vce.cpu_addr, 0, size); 138d93f7937SChristian König memcpy(rdev->vce.cpu_addr, rdev->vce_fw->data, rdev->vce_fw->size); 139d93f7937SChristian König 140d93f7937SChristian König r = radeon_vce_suspend(rdev); 141d93f7937SChristian König if (r) 142d93f7937SChristian König return r; 143d93f7937SChristian König 144d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 145d93f7937SChristian König atomic_set(&rdev->vce.handles[i], 0); 146d93f7937SChristian König rdev->vce.filp[i] = NULL; 147d93f7937SChristian König } 148d93f7937SChristian König 149d93f7937SChristian König return 0; 150d93f7937SChristian König } 151d93f7937SChristian König 152d93f7937SChristian König /** 153d93f7937SChristian König * radeon_vce_fini - free memory 154d93f7937SChristian König * 155d93f7937SChristian König * @rdev: radeon_device pointer 156d93f7937SChristian König * 157d93f7937SChristian König * Last step on VCE teardown, free firmware memory 158d93f7937SChristian König */ 159d93f7937SChristian König void radeon_vce_fini(struct radeon_device *rdev) 160d93f7937SChristian König { 161d93f7937SChristian König radeon_vce_suspend(rdev); 162d93f7937SChristian König radeon_bo_unref(&rdev->vce.vcpu_bo); 163d93f7937SChristian König } 164d93f7937SChristian König 165d93f7937SChristian König /** 166d93f7937SChristian König * radeon_vce_suspend - unpin VCE fw memory 167d93f7937SChristian König * 168d93f7937SChristian König * @rdev: radeon_device pointer 169d93f7937SChristian König * 170d93f7937SChristian König * TODO: Test VCE suspend/resume 171d93f7937SChristian König */ 172d93f7937SChristian König int radeon_vce_suspend(struct radeon_device *rdev) 173d93f7937SChristian König { 174d93f7937SChristian König int r; 175d93f7937SChristian König 176d93f7937SChristian König if (rdev->vce.vcpu_bo == NULL) 177d93f7937SChristian König return 0; 178d93f7937SChristian König 179d93f7937SChristian König r = radeon_bo_reserve(rdev->vce.vcpu_bo, false); 180d93f7937SChristian König if (!r) { 181d93f7937SChristian König radeon_bo_kunmap(rdev->vce.vcpu_bo); 182d93f7937SChristian König radeon_bo_unpin(rdev->vce.vcpu_bo); 183d93f7937SChristian König radeon_bo_unreserve(rdev->vce.vcpu_bo); 184d93f7937SChristian König } 185d93f7937SChristian König return r; 186d93f7937SChristian König } 187d93f7937SChristian König 188d93f7937SChristian König /** 189d93f7937SChristian König * radeon_vce_resume - pin VCE fw memory 190d93f7937SChristian König * 191d93f7937SChristian König * @rdev: radeon_device pointer 192d93f7937SChristian König * 193d93f7937SChristian König * TODO: Test VCE suspend/resume 194d93f7937SChristian König */ 195d93f7937SChristian König int radeon_vce_resume(struct radeon_device *rdev) 196d93f7937SChristian König { 197d93f7937SChristian König int r; 198d93f7937SChristian König 199d93f7937SChristian König if (rdev->vce.vcpu_bo == NULL) 200d93f7937SChristian König return -EINVAL; 201d93f7937SChristian König 202d93f7937SChristian König r = radeon_bo_reserve(rdev->vce.vcpu_bo, false); 203d93f7937SChristian König if (r) { 204d93f7937SChristian König radeon_bo_unref(&rdev->vce.vcpu_bo); 205d93f7937SChristian König dev_err(rdev->dev, "(%d) failed to reserve VCE bo\n", r); 206d93f7937SChristian König return r; 207d93f7937SChristian König } 208d93f7937SChristian König 209d93f7937SChristian König r = radeon_bo_pin(rdev->vce.vcpu_bo, RADEON_GEM_DOMAIN_VRAM, 210d93f7937SChristian König &rdev->vce.gpu_addr); 211d93f7937SChristian König if (r) { 212d93f7937SChristian König radeon_bo_unreserve(rdev->vce.vcpu_bo); 213d93f7937SChristian König radeon_bo_unref(&rdev->vce.vcpu_bo); 214d93f7937SChristian König dev_err(rdev->dev, "(%d) VCE bo pin failed\n", r); 215d93f7937SChristian König return r; 216d93f7937SChristian König } 217d93f7937SChristian König 218d93f7937SChristian König r = radeon_bo_kmap(rdev->vce.vcpu_bo, &rdev->vce.cpu_addr); 219d93f7937SChristian König if (r) { 220d93f7937SChristian König dev_err(rdev->dev, "(%d) VCE map failed\n", r); 221d93f7937SChristian König return r; 222d93f7937SChristian König } 223d93f7937SChristian König 224d93f7937SChristian König radeon_bo_unreserve(rdev->vce.vcpu_bo); 225d93f7937SChristian König 226d93f7937SChristian König return 0; 227d93f7937SChristian König } 228d93f7937SChristian König 229d93f7937SChristian König /** 230*03afe6f6SAlex Deucher * radeon_vce_idle_work_handler - power off VCE 231*03afe6f6SAlex Deucher * 232*03afe6f6SAlex Deucher * @work: pointer to work structure 233*03afe6f6SAlex Deucher * 234*03afe6f6SAlex Deucher * power of VCE when it's not used any more 235*03afe6f6SAlex Deucher */ 236*03afe6f6SAlex Deucher static void radeon_vce_idle_work_handler(struct work_struct *work) 237*03afe6f6SAlex Deucher { 238*03afe6f6SAlex Deucher struct radeon_device *rdev = 239*03afe6f6SAlex Deucher container_of(work, struct radeon_device, vce.idle_work.work); 240*03afe6f6SAlex Deucher 241*03afe6f6SAlex Deucher if ((radeon_fence_count_emitted(rdev, TN_RING_TYPE_VCE1_INDEX) == 0) && 242*03afe6f6SAlex Deucher (radeon_fence_count_emitted(rdev, TN_RING_TYPE_VCE2_INDEX) == 0)) { 243*03afe6f6SAlex Deucher if ((rdev->pm.pm_method == PM_METHOD_DPM) && rdev->pm.dpm_enabled) { 244*03afe6f6SAlex Deucher radeon_dpm_enable_vce(rdev, false); 245*03afe6f6SAlex Deucher } else { 246*03afe6f6SAlex Deucher radeon_set_vce_clocks(rdev, 0, 0); 247*03afe6f6SAlex Deucher } 248*03afe6f6SAlex Deucher } else { 249*03afe6f6SAlex Deucher schedule_delayed_work(&rdev->vce.idle_work, 250*03afe6f6SAlex Deucher msecs_to_jiffies(VCE_IDLE_TIMEOUT_MS)); 251*03afe6f6SAlex Deucher } 252*03afe6f6SAlex Deucher } 253*03afe6f6SAlex Deucher 254*03afe6f6SAlex Deucher /** 255*03afe6f6SAlex Deucher * radeon_vce_note_usage - power up VCE 256*03afe6f6SAlex Deucher * 257*03afe6f6SAlex Deucher * @rdev: radeon_device pointer 258*03afe6f6SAlex Deucher * 259*03afe6f6SAlex Deucher * Make sure VCE is powerd up when we want to use it 260*03afe6f6SAlex Deucher */ 261*03afe6f6SAlex Deucher void radeon_vce_note_usage(struct radeon_device *rdev) 262*03afe6f6SAlex Deucher { 263*03afe6f6SAlex Deucher bool streams_changed = false; 264*03afe6f6SAlex Deucher bool set_clocks = !cancel_delayed_work_sync(&rdev->vce.idle_work); 265*03afe6f6SAlex Deucher set_clocks &= schedule_delayed_work(&rdev->vce.idle_work, 266*03afe6f6SAlex Deucher msecs_to_jiffies(VCE_IDLE_TIMEOUT_MS)); 267*03afe6f6SAlex Deucher 268*03afe6f6SAlex Deucher if ((rdev->pm.pm_method == PM_METHOD_DPM) && rdev->pm.dpm_enabled) { 269*03afe6f6SAlex Deucher /* XXX figure out if the streams changed */ 270*03afe6f6SAlex Deucher streams_changed = false; 271*03afe6f6SAlex Deucher } 272*03afe6f6SAlex Deucher 273*03afe6f6SAlex Deucher if (set_clocks || streams_changed) { 274*03afe6f6SAlex Deucher if ((rdev->pm.pm_method == PM_METHOD_DPM) && rdev->pm.dpm_enabled) { 275*03afe6f6SAlex Deucher radeon_dpm_enable_vce(rdev, true); 276*03afe6f6SAlex Deucher } else { 277*03afe6f6SAlex Deucher radeon_set_vce_clocks(rdev, 53300, 40000); 278*03afe6f6SAlex Deucher } 279*03afe6f6SAlex Deucher } 280*03afe6f6SAlex Deucher } 281*03afe6f6SAlex Deucher 282*03afe6f6SAlex Deucher /** 283d93f7937SChristian König * radeon_vce_free_handles - free still open VCE handles 284d93f7937SChristian König * 285d93f7937SChristian König * @rdev: radeon_device pointer 286d93f7937SChristian König * @filp: drm file pointer 287d93f7937SChristian König * 288d93f7937SChristian König * Close all VCE handles still open by this file pointer 289d93f7937SChristian König */ 290d93f7937SChristian König void radeon_vce_free_handles(struct radeon_device *rdev, struct drm_file *filp) 291d93f7937SChristian König { 292d93f7937SChristian König int i, r; 293d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 294d93f7937SChristian König uint32_t handle = atomic_read(&rdev->vce.handles[i]); 295d93f7937SChristian König if (!handle || rdev->vce.filp[i] != filp) 296d93f7937SChristian König continue; 297d93f7937SChristian König 298*03afe6f6SAlex Deucher radeon_vce_note_usage(rdev); 299*03afe6f6SAlex Deucher 300d93f7937SChristian König r = radeon_vce_get_destroy_msg(rdev, TN_RING_TYPE_VCE1_INDEX, 301d93f7937SChristian König handle, NULL); 302d93f7937SChristian König if (r) 303d93f7937SChristian König DRM_ERROR("Error destroying VCE handle (%d)!\n", r); 304d93f7937SChristian König 305d93f7937SChristian König rdev->vce.filp[i] = NULL; 306d93f7937SChristian König atomic_set(&rdev->vce.handles[i], 0); 307d93f7937SChristian König } 308d93f7937SChristian König } 309d93f7937SChristian König 310d93f7937SChristian König /** 311d93f7937SChristian König * radeon_vce_get_create_msg - generate a VCE create msg 312d93f7937SChristian König * 313d93f7937SChristian König * @rdev: radeon_device pointer 314d93f7937SChristian König * @ring: ring we should submit the msg to 315d93f7937SChristian König * @handle: VCE session handle to use 316d93f7937SChristian König * @fence: optional fence to return 317d93f7937SChristian König * 318d93f7937SChristian König * Open up a stream for HW test 319d93f7937SChristian König */ 320d93f7937SChristian König int radeon_vce_get_create_msg(struct radeon_device *rdev, int ring, 321d93f7937SChristian König uint32_t handle, struct radeon_fence **fence) 322d93f7937SChristian König { 323d93f7937SChristian König const unsigned ib_size_dw = 1024; 324d93f7937SChristian König struct radeon_ib ib; 325d93f7937SChristian König uint64_t dummy; 326d93f7937SChristian König int i, r; 327d93f7937SChristian König 328d93f7937SChristian König r = radeon_ib_get(rdev, ring, &ib, NULL, ib_size_dw * 4); 329d93f7937SChristian König if (r) { 330d93f7937SChristian König DRM_ERROR("radeon: failed to get ib (%d).\n", r); 331d93f7937SChristian König return r; 332d93f7937SChristian König } 333d93f7937SChristian König 334d93f7937SChristian König dummy = ib.gpu_addr + 1024; 335d93f7937SChristian König 336d93f7937SChristian König /* stitch together an VCE create msg */ 337d93f7937SChristian König ib.length_dw = 0; 338d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000c; /* len */ 339d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; /* session cmd */ 340d93f7937SChristian König ib.ptr[ib.length_dw++] = handle; 341d93f7937SChristian König 342d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000030; /* len */ 343d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x01000001; /* create cmd */ 344d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000000; 345d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000042; 346d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000a; 347d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; 348d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000080; 349d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000060; 350d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000100; 351d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000100; 352d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000c; 353d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000000; 354d93f7937SChristian König 355d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000014; /* len */ 356d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x05000005; /* feedback buffer */ 357d93f7937SChristian König ib.ptr[ib.length_dw++] = upper_32_bits(dummy); 358d93f7937SChristian König ib.ptr[ib.length_dw++] = dummy; 359d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; 360d93f7937SChristian König 361d93f7937SChristian König for (i = ib.length_dw; i < ib_size_dw; ++i) 362d93f7937SChristian König ib.ptr[i] = 0x0; 363d93f7937SChristian König 364d93f7937SChristian König r = radeon_ib_schedule(rdev, &ib, NULL); 365d93f7937SChristian König if (r) { 366d93f7937SChristian König DRM_ERROR("radeon: failed to schedule ib (%d).\n", r); 367d93f7937SChristian König } 368d93f7937SChristian König 369d93f7937SChristian König if (fence) 370d93f7937SChristian König *fence = radeon_fence_ref(ib.fence); 371d93f7937SChristian König 372d93f7937SChristian König radeon_ib_free(rdev, &ib); 373d93f7937SChristian König 374d93f7937SChristian König return r; 375d93f7937SChristian König } 376d93f7937SChristian König 377d93f7937SChristian König /** 378d93f7937SChristian König * radeon_vce_get_destroy_msg - generate a VCE destroy msg 379d93f7937SChristian König * 380d93f7937SChristian König * @rdev: radeon_device pointer 381d93f7937SChristian König * @ring: ring we should submit the msg to 382d93f7937SChristian König * @handle: VCE session handle to use 383d93f7937SChristian König * @fence: optional fence to return 384d93f7937SChristian König * 385d93f7937SChristian König * Close up a stream for HW test or if userspace failed to do so 386d93f7937SChristian König */ 387d93f7937SChristian König int radeon_vce_get_destroy_msg(struct radeon_device *rdev, int ring, 388d93f7937SChristian König uint32_t handle, struct radeon_fence **fence) 389d93f7937SChristian König { 390d93f7937SChristian König const unsigned ib_size_dw = 1024; 391d93f7937SChristian König struct radeon_ib ib; 392d93f7937SChristian König uint64_t dummy; 393d93f7937SChristian König int i, r; 394d93f7937SChristian König 395d93f7937SChristian König r = radeon_ib_get(rdev, ring, &ib, NULL, ib_size_dw * 4); 396d93f7937SChristian König if (r) { 397d93f7937SChristian König DRM_ERROR("radeon: failed to get ib (%d).\n", r); 398d93f7937SChristian König return r; 399d93f7937SChristian König } 400d93f7937SChristian König 401d93f7937SChristian König dummy = ib.gpu_addr + 1024; 402d93f7937SChristian König 403d93f7937SChristian König /* stitch together an VCE destroy msg */ 404d93f7937SChristian König ib.length_dw = 0; 405d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000c; /* len */ 406d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; /* session cmd */ 407d93f7937SChristian König ib.ptr[ib.length_dw++] = handle; 408d93f7937SChristian König 409d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000014; /* len */ 410d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x05000005; /* feedback buffer */ 411d93f7937SChristian König ib.ptr[ib.length_dw++] = upper_32_bits(dummy); 412d93f7937SChristian König ib.ptr[ib.length_dw++] = dummy; 413d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; 414d93f7937SChristian König 415d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000008; /* len */ 416d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x02000001; /* destroy cmd */ 417d93f7937SChristian König 418d93f7937SChristian König for (i = ib.length_dw; i < ib_size_dw; ++i) 419d93f7937SChristian König ib.ptr[i] = 0x0; 420d93f7937SChristian König 421d93f7937SChristian König r = radeon_ib_schedule(rdev, &ib, NULL); 422d93f7937SChristian König if (r) { 423d93f7937SChristian König DRM_ERROR("radeon: failed to schedule ib (%d).\n", r); 424d93f7937SChristian König } 425d93f7937SChristian König 426d93f7937SChristian König if (fence) 427d93f7937SChristian König *fence = radeon_fence_ref(ib.fence); 428d93f7937SChristian König 429d93f7937SChristian König radeon_ib_free(rdev, &ib); 430d93f7937SChristian König 431d93f7937SChristian König return r; 432d93f7937SChristian König } 433d93f7937SChristian König 434d93f7937SChristian König /** 435d93f7937SChristian König * radeon_vce_cs_reloc - command submission relocation 436d93f7937SChristian König * 437d93f7937SChristian König * @p: parser context 438d93f7937SChristian König * @lo: address of lower dword 439d93f7937SChristian König * @hi: address of higher dword 440d93f7937SChristian König * 441d93f7937SChristian König * Patch relocation inside command stream with real buffer address 442d93f7937SChristian König */ 443d93f7937SChristian König int radeon_vce_cs_reloc(struct radeon_cs_parser *p, int lo, int hi) 444d93f7937SChristian König { 445d93f7937SChristian König struct radeon_cs_chunk *relocs_chunk; 446d93f7937SChristian König uint64_t offset; 447d93f7937SChristian König unsigned idx; 448d93f7937SChristian König 449d93f7937SChristian König relocs_chunk = &p->chunks[p->chunk_relocs_idx]; 450d93f7937SChristian König offset = radeon_get_ib_value(p, lo); 451d93f7937SChristian König idx = radeon_get_ib_value(p, hi); 452d93f7937SChristian König 453d93f7937SChristian König if (idx >= relocs_chunk->length_dw) { 454d93f7937SChristian König DRM_ERROR("Relocs at %d after relocations chunk end %d !\n", 455d93f7937SChristian König idx, relocs_chunk->length_dw); 456d93f7937SChristian König return -EINVAL; 457d93f7937SChristian König } 458d93f7937SChristian König 459d93f7937SChristian König offset += p->relocs_ptr[(idx / 4)]->lobj.gpu_offset; 460d93f7937SChristian König 461d93f7937SChristian König p->ib.ptr[lo] = offset & 0xFFFFFFFF; 462d93f7937SChristian König p->ib.ptr[hi] = offset >> 32; 463d93f7937SChristian König 464d93f7937SChristian König return 0; 465d93f7937SChristian König } 466d93f7937SChristian König 467d93f7937SChristian König /** 468d93f7937SChristian König * radeon_vce_cs_parse - parse and validate the command stream 469d93f7937SChristian König * 470d93f7937SChristian König * @p: parser context 471d93f7937SChristian König * 472d93f7937SChristian König */ 473d93f7937SChristian König int radeon_vce_cs_parse(struct radeon_cs_parser *p) 474d93f7937SChristian König { 475d93f7937SChristian König uint32_t handle = 0; 476d93f7937SChristian König bool destroy = false; 477d93f7937SChristian König int i, r; 478d93f7937SChristian König 479d93f7937SChristian König while (p->idx < p->chunks[p->chunk_ib_idx].length_dw) { 480d93f7937SChristian König uint32_t len = radeon_get_ib_value(p, p->idx); 481d93f7937SChristian König uint32_t cmd = radeon_get_ib_value(p, p->idx + 1); 482d93f7937SChristian König 483d93f7937SChristian König if ((len < 8) || (len & 3)) { 484d93f7937SChristian König DRM_ERROR("invalid VCE command length (%d)!\n", len); 485d93f7937SChristian König return -EINVAL; 486d93f7937SChristian König } 487d93f7937SChristian König 488d93f7937SChristian König switch (cmd) { 489d93f7937SChristian König case 0x00000001: // session 490d93f7937SChristian König handle = radeon_get_ib_value(p, p->idx + 2); 491d93f7937SChristian König break; 492d93f7937SChristian König 493d93f7937SChristian König case 0x00000002: // task info 494d93f7937SChristian König case 0x01000001: // create 495d93f7937SChristian König case 0x04000001: // config extension 496d93f7937SChristian König case 0x04000002: // pic control 497d93f7937SChristian König case 0x04000005: // rate control 498d93f7937SChristian König case 0x04000007: // motion estimation 499d93f7937SChristian König case 0x04000008: // rdo 500d93f7937SChristian König break; 501d93f7937SChristian König 502d93f7937SChristian König case 0x03000001: // encode 503d93f7937SChristian König r = radeon_vce_cs_reloc(p, p->idx + 10, p->idx + 9); 504d93f7937SChristian König if (r) 505d93f7937SChristian König return r; 506d93f7937SChristian König 507d93f7937SChristian König r = radeon_vce_cs_reloc(p, p->idx + 12, p->idx + 11); 508d93f7937SChristian König if (r) 509d93f7937SChristian König return r; 510d93f7937SChristian König break; 511d93f7937SChristian König 512d93f7937SChristian König case 0x02000001: // destroy 513d93f7937SChristian König destroy = true; 514d93f7937SChristian König break; 515d93f7937SChristian König 516d93f7937SChristian König case 0x05000001: // context buffer 517d93f7937SChristian König case 0x05000004: // video bitstream buffer 518d93f7937SChristian König case 0x05000005: // feedback buffer 519d93f7937SChristian König r = radeon_vce_cs_reloc(p, p->idx + 3, p->idx + 2); 520d93f7937SChristian König if (r) 521d93f7937SChristian König return r; 522d93f7937SChristian König break; 523d93f7937SChristian König 524d93f7937SChristian König default: 525d93f7937SChristian König DRM_ERROR("invalid VCE command (0x%x)!\n", cmd); 526d93f7937SChristian König return -EINVAL; 527d93f7937SChristian König } 528d93f7937SChristian König 529d93f7937SChristian König p->idx += len / 4; 530d93f7937SChristian König } 531d93f7937SChristian König 532d93f7937SChristian König if (destroy) { 533d93f7937SChristian König /* IB contains a destroy msg, free the handle */ 534d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) 535d93f7937SChristian König atomic_cmpxchg(&p->rdev->vce.handles[i], handle, 0); 536d93f7937SChristian König 537d93f7937SChristian König return 0; 538d93f7937SChristian König } 539d93f7937SChristian König 540d93f7937SChristian König /* create or encode, validate the handle */ 541d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 542d93f7937SChristian König if (atomic_read(&p->rdev->vce.handles[i]) == handle) 543d93f7937SChristian König return 0; 544d93f7937SChristian König } 545d93f7937SChristian König 546d93f7937SChristian König /* handle not found try to alloc a new one */ 547d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 548d93f7937SChristian König if (!atomic_cmpxchg(&p->rdev->vce.handles[i], 0, handle)) { 549d93f7937SChristian König p->rdev->vce.filp[i] = p->filp; 550d93f7937SChristian König return 0; 551d93f7937SChristian König } 552d93f7937SChristian König } 553d93f7937SChristian König 554d93f7937SChristian König DRM_ERROR("No more free VCE handles!\n"); 555d93f7937SChristian König return -EINVAL; 556d93f7937SChristian König } 557d93f7937SChristian König 558d93f7937SChristian König /** 559d93f7937SChristian König * radeon_vce_semaphore_emit - emit a semaphore command 560d93f7937SChristian König * 561d93f7937SChristian König * @rdev: radeon_device pointer 562d93f7937SChristian König * @ring: engine to use 563d93f7937SChristian König * @semaphore: address of semaphore 564d93f7937SChristian König * @emit_wait: true=emit wait, false=emit signal 565d93f7937SChristian König * 566d93f7937SChristian König */ 567d93f7937SChristian König bool radeon_vce_semaphore_emit(struct radeon_device *rdev, 568d93f7937SChristian König struct radeon_ring *ring, 569d93f7937SChristian König struct radeon_semaphore *semaphore, 570d93f7937SChristian König bool emit_wait) 571d93f7937SChristian König { 572d93f7937SChristian König uint64_t addr = semaphore->gpu_addr; 573d93f7937SChristian König 574d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_SEMAPHORE); 575d93f7937SChristian König radeon_ring_write(ring, (addr >> 3) & 0x000FFFFF); 576d93f7937SChristian König radeon_ring_write(ring, (addr >> 23) & 0x000FFFFF); 577d93f7937SChristian König radeon_ring_write(ring, 0x01003000 | (emit_wait ? 1 : 0)); 578d93f7937SChristian König if (!emit_wait) 579d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_END); 580d93f7937SChristian König 581d93f7937SChristian König return true; 582d93f7937SChristian König } 583d93f7937SChristian König 584d93f7937SChristian König /** 585d93f7937SChristian König * radeon_vce_ib_execute - execute indirect buffer 586d93f7937SChristian König * 587d93f7937SChristian König * @rdev: radeon_device pointer 588d93f7937SChristian König * @ib: the IB to execute 589d93f7937SChristian König * 590d93f7937SChristian König */ 591d93f7937SChristian König void radeon_vce_ib_execute(struct radeon_device *rdev, struct radeon_ib *ib) 592d93f7937SChristian König { 593d93f7937SChristian König struct radeon_ring *ring = &rdev->ring[ib->ring]; 594d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_IB); 595d93f7937SChristian König radeon_ring_write(ring, ib->gpu_addr); 596d93f7937SChristian König radeon_ring_write(ring, upper_32_bits(ib->gpu_addr)); 597d93f7937SChristian König radeon_ring_write(ring, ib->length_dw); 598d93f7937SChristian König } 599d93f7937SChristian König 600d93f7937SChristian König /** 601d93f7937SChristian König * radeon_vce_fence_emit - add a fence command to the ring 602d93f7937SChristian König * 603d93f7937SChristian König * @rdev: radeon_device pointer 604d93f7937SChristian König * @fence: the fence 605d93f7937SChristian König * 606d93f7937SChristian König */ 607d93f7937SChristian König void radeon_vce_fence_emit(struct radeon_device *rdev, 608d93f7937SChristian König struct radeon_fence *fence) 609d93f7937SChristian König { 610d93f7937SChristian König struct radeon_ring *ring = &rdev->ring[fence->ring]; 611d93f7937SChristian König uint32_t addr = rdev->fence_drv[fence->ring].gpu_addr; 612d93f7937SChristian König 613d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_FENCE); 614d93f7937SChristian König radeon_ring_write(ring, addr); 615d93f7937SChristian König radeon_ring_write(ring, upper_32_bits(addr)); 616d93f7937SChristian König radeon_ring_write(ring, fence->seq); 617d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_TRAP); 618d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_END); 619d93f7937SChristian König } 620d93f7937SChristian König 621d93f7937SChristian König /** 622d93f7937SChristian König * radeon_vce_ring_test - test if VCE ring is working 623d93f7937SChristian König * 624d93f7937SChristian König * @rdev: radeon_device pointer 625d93f7937SChristian König * @ring: the engine to test on 626d93f7937SChristian König * 627d93f7937SChristian König */ 628d93f7937SChristian König int radeon_vce_ring_test(struct radeon_device *rdev, struct radeon_ring *ring) 629d93f7937SChristian König { 630d93f7937SChristian König uint32_t rptr = vce_v1_0_get_rptr(rdev, ring); 631d93f7937SChristian König unsigned i; 632d93f7937SChristian König int r; 633d93f7937SChristian König 634d93f7937SChristian König r = radeon_ring_lock(rdev, ring, 16); 635d93f7937SChristian König if (r) { 636d93f7937SChristian König DRM_ERROR("radeon: vce failed to lock ring %d (%d).\n", 637d93f7937SChristian König ring->idx, r); 638d93f7937SChristian König return r; 639d93f7937SChristian König } 640d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_END); 641d93f7937SChristian König radeon_ring_unlock_commit(rdev, ring); 642d93f7937SChristian König 643d93f7937SChristian König for (i = 0; i < rdev->usec_timeout; i++) { 644d93f7937SChristian König if (vce_v1_0_get_rptr(rdev, ring) != rptr) 645d93f7937SChristian König break; 646d93f7937SChristian König DRM_UDELAY(1); 647d93f7937SChristian König } 648d93f7937SChristian König 649d93f7937SChristian König if (i < rdev->usec_timeout) { 650d93f7937SChristian König DRM_INFO("ring test on %d succeeded in %d usecs\n", 651d93f7937SChristian König ring->idx, i); 652d93f7937SChristian König } else { 653d93f7937SChristian König DRM_ERROR("radeon: ring %d test failed\n", 654d93f7937SChristian König ring->idx); 655d93f7937SChristian König r = -ETIMEDOUT; 656d93f7937SChristian König } 657d93f7937SChristian König 658d93f7937SChristian König return r; 659d93f7937SChristian König } 660d93f7937SChristian König 661d93f7937SChristian König /** 662d93f7937SChristian König * radeon_vce_ib_test - test if VCE IBs are working 663d93f7937SChristian König * 664d93f7937SChristian König * @rdev: radeon_device pointer 665d93f7937SChristian König * @ring: the engine to test on 666d93f7937SChristian König * 667d93f7937SChristian König */ 668d93f7937SChristian König int radeon_vce_ib_test(struct radeon_device *rdev, struct radeon_ring *ring) 669d93f7937SChristian König { 670d93f7937SChristian König struct radeon_fence *fence = NULL; 671d93f7937SChristian König int r; 672d93f7937SChristian König 673d93f7937SChristian König r = radeon_vce_get_create_msg(rdev, ring->idx, 1, NULL); 674d93f7937SChristian König if (r) { 675d93f7937SChristian König DRM_ERROR("radeon: failed to get create msg (%d).\n", r); 676d93f7937SChristian König goto error; 677d93f7937SChristian König } 678d93f7937SChristian König 679d93f7937SChristian König r = radeon_vce_get_destroy_msg(rdev, ring->idx, 1, &fence); 680d93f7937SChristian König if (r) { 681d93f7937SChristian König DRM_ERROR("radeon: failed to get destroy ib (%d).\n", r); 682d93f7937SChristian König goto error; 683d93f7937SChristian König } 684d93f7937SChristian König 685d93f7937SChristian König r = radeon_fence_wait(fence, false); 686d93f7937SChristian König if (r) { 687d93f7937SChristian König DRM_ERROR("radeon: fence wait failed (%d).\n", r); 688d93f7937SChristian König } else { 689d93f7937SChristian König DRM_INFO("ib test on ring %d succeeded\n", ring->idx); 690d93f7937SChristian König } 691d93f7937SChristian König error: 692d93f7937SChristian König radeon_fence_unref(&fence); 693d93f7937SChristian König return r; 694d93f7937SChristian König } 695