1d93f7937SChristian König /* 2d93f7937SChristian König * Copyright 2013 Advanced Micro Devices, Inc. 3d93f7937SChristian König * All Rights Reserved. 4d93f7937SChristian König * 5d93f7937SChristian König * Permission is hereby granted, free of charge, to any person obtaining a 6d93f7937SChristian König * copy of this software and associated documentation files (the 7d93f7937SChristian König * "Software"), to deal in the Software without restriction, including 8d93f7937SChristian König * without limitation the rights to use, copy, modify, merge, publish, 9d93f7937SChristian König * distribute, sub license, and/or sell copies of the Software, and to 10d93f7937SChristian König * permit persons to whom the Software is furnished to do so, subject to 11d93f7937SChristian König * the following conditions: 12d93f7937SChristian König * 13d93f7937SChristian König * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR 14d93f7937SChristian König * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, 15d93f7937SChristian König * FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL 16d93f7937SChristian König * THE COPYRIGHT HOLDERS, AUTHORS AND/OR ITS SUPPLIERS BE LIABLE FOR ANY CLAIM, 17d93f7937SChristian König * DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR 18d93f7937SChristian König * OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE 19d93f7937SChristian König * USE OR OTHER DEALINGS IN THE SOFTWARE. 20d93f7937SChristian König * 21d93f7937SChristian König * The above copyright notice and this permission notice (including the 22d93f7937SChristian König * next paragraph) shall be included in all copies or substantial portions 23d93f7937SChristian König * of the Software. 24d93f7937SChristian König * 25d93f7937SChristian König * Authors: Christian König <christian.koenig@amd.com> 26d93f7937SChristian König */ 27d93f7937SChristian König 28d93f7937SChristian König #include <linux/firmware.h> 29d93f7937SChristian König #include <linux/module.h> 30d93f7937SChristian König #include <drm/drmP.h> 31d93f7937SChristian König #include <drm/drm.h> 32d93f7937SChristian König 33d93f7937SChristian König #include "radeon.h" 34d93f7937SChristian König #include "radeon_asic.h" 35d93f7937SChristian König #include "sid.h" 36d93f7937SChristian König 3703afe6f6SAlex Deucher /* 1 second timeout */ 3803afe6f6SAlex Deucher #define VCE_IDLE_TIMEOUT_MS 1000 3903afe6f6SAlex Deucher 40d93f7937SChristian König /* Firmware Names */ 41d93f7937SChristian König #define FIRMWARE_BONAIRE "radeon/BONAIRE_vce.bin" 42d93f7937SChristian König 43d93f7937SChristian König MODULE_FIRMWARE(FIRMWARE_BONAIRE); 44d93f7937SChristian König 4503afe6f6SAlex Deucher static void radeon_vce_idle_work_handler(struct work_struct *work); 4603afe6f6SAlex Deucher 47d93f7937SChristian König /** 48d93f7937SChristian König * radeon_vce_init - allocate memory, load vce firmware 49d93f7937SChristian König * 50d93f7937SChristian König * @rdev: radeon_device pointer 51d93f7937SChristian König * 52d93f7937SChristian König * First step to get VCE online, allocate memory and load the firmware 53d93f7937SChristian König */ 54d93f7937SChristian König int radeon_vce_init(struct radeon_device *rdev) 55d93f7937SChristian König { 5698ccc291SChristian König static const char *fw_version = "[ATI LIB=VCEFW,"; 5798ccc291SChristian König static const char *fb_version = "[ATI LIB=VCEFWSTATS,"; 5898ccc291SChristian König unsigned long size; 5998ccc291SChristian König const char *fw_name, *c; 6098ccc291SChristian König uint8_t start, mid, end; 61d93f7937SChristian König int i, r; 62d93f7937SChristian König 6303afe6f6SAlex Deucher INIT_DELAYED_WORK(&rdev->vce.idle_work, radeon_vce_idle_work_handler); 6403afe6f6SAlex Deucher 65d93f7937SChristian König switch (rdev->family) { 66d93f7937SChristian König case CHIP_BONAIRE: 67d93f7937SChristian König case CHIP_KAVERI: 68d93f7937SChristian König case CHIP_KABINI: 69d93f7937SChristian König fw_name = FIRMWARE_BONAIRE; 70d93f7937SChristian König break; 71d93f7937SChristian König 72d93f7937SChristian König default: 73d93f7937SChristian König return -EINVAL; 74d93f7937SChristian König } 75d93f7937SChristian König 76d93f7937SChristian König r = request_firmware(&rdev->vce_fw, fw_name, rdev->dev); 77d93f7937SChristian König if (r) { 78d93f7937SChristian König dev_err(rdev->dev, "radeon_vce: Can't load firmware \"%s\"\n", 79d93f7937SChristian König fw_name); 80d93f7937SChristian König return r; 81d93f7937SChristian König } 82d93f7937SChristian König 8398ccc291SChristian König /* search for firmware version */ 8498ccc291SChristian König 8598ccc291SChristian König size = rdev->vce_fw->size - strlen(fw_version) - 9; 8698ccc291SChristian König c = rdev->vce_fw->data; 8798ccc291SChristian König for (;size > 0; --size, ++c) 8898ccc291SChristian König if (strncmp(c, fw_version, strlen(fw_version)) == 0) 8998ccc291SChristian König break; 9098ccc291SChristian König 9198ccc291SChristian König if (size == 0) 9298ccc291SChristian König return -EINVAL; 9398ccc291SChristian König 9498ccc291SChristian König c += strlen(fw_version); 9598ccc291SChristian König if (sscanf(c, "%2hhd.%2hhd.%2hhd]", &start, &mid, &end) != 3) 9698ccc291SChristian König return -EINVAL; 9798ccc291SChristian König 9898ccc291SChristian König /* search for feedback version */ 9998ccc291SChristian König 10098ccc291SChristian König size = rdev->vce_fw->size - strlen(fb_version) - 3; 10198ccc291SChristian König c = rdev->vce_fw->data; 10298ccc291SChristian König for (;size > 0; --size, ++c) 10398ccc291SChristian König if (strncmp(c, fb_version, strlen(fb_version)) == 0) 10498ccc291SChristian König break; 10598ccc291SChristian König 10698ccc291SChristian König if (size == 0) 10798ccc291SChristian König return -EINVAL; 10898ccc291SChristian König 10998ccc291SChristian König c += strlen(fb_version); 11098ccc291SChristian König if (sscanf(c, "%2u]", &rdev->vce.fb_version) != 1) 11198ccc291SChristian König return -EINVAL; 11298ccc291SChristian König 11398ccc291SChristian König DRM_INFO("Found VCE firmware/feedback version %hhd.%hhd.%hhd / %d!\n", 11498ccc291SChristian König start, mid, end, rdev->vce.fb_version); 11598ccc291SChristian König 11698ccc291SChristian König rdev->vce.fw_version = (start << 24) | (mid << 16) | (end << 8); 11798ccc291SChristian König 11898ccc291SChristian König /* we can only work with this fw version for now */ 11998ccc291SChristian König if (rdev->vce.fw_version != ((40 << 24) | (2 << 16) | (2 << 8))) 12098ccc291SChristian König return -EINVAL; 12198ccc291SChristian König 122b03b4e4bSChristian König /* allocate firmware, stack and heap BO */ 12398ccc291SChristian König 12498ccc291SChristian König size = RADEON_GPU_PAGE_ALIGN(rdev->vce_fw->size) + 125d93f7937SChristian König RADEON_VCE_STACK_SIZE + RADEON_VCE_HEAP_SIZE; 12698ccc291SChristian König r = radeon_bo_create(rdev, size, PAGE_SIZE, true, 127d93f7937SChristian König RADEON_GEM_DOMAIN_VRAM, NULL, &rdev->vce.vcpu_bo); 128d93f7937SChristian König if (r) { 129d93f7937SChristian König dev_err(rdev->dev, "(%d) failed to allocate VCE bo\n", r); 130d93f7937SChristian König return r; 131d93f7937SChristian König } 132d93f7937SChristian König 133b03b4e4bSChristian König r = radeon_bo_reserve(rdev->vce.vcpu_bo, false); 134b03b4e4bSChristian König if (r) { 135b03b4e4bSChristian König radeon_bo_unref(&rdev->vce.vcpu_bo); 136b03b4e4bSChristian König dev_err(rdev->dev, "(%d) failed to reserve VCE bo\n", r); 137d93f7937SChristian König return r; 138b03b4e4bSChristian König } 139d93f7937SChristian König 140b03b4e4bSChristian König r = radeon_bo_pin(rdev->vce.vcpu_bo, RADEON_GEM_DOMAIN_VRAM, 141b03b4e4bSChristian König &rdev->vce.gpu_addr); 142b03b4e4bSChristian König radeon_bo_unreserve(rdev->vce.vcpu_bo); 143b03b4e4bSChristian König if (r) { 144b03b4e4bSChristian König radeon_bo_unref(&rdev->vce.vcpu_bo); 145b03b4e4bSChristian König dev_err(rdev->dev, "(%d) VCE bo pin failed\n", r); 146d93f7937SChristian König return r; 147b03b4e4bSChristian König } 148d93f7937SChristian König 149d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 150d93f7937SChristian König atomic_set(&rdev->vce.handles[i], 0); 151d93f7937SChristian König rdev->vce.filp[i] = NULL; 152d93f7937SChristian König } 153d93f7937SChristian König 154d93f7937SChristian König return 0; 155d93f7937SChristian König } 156d93f7937SChristian König 157d93f7937SChristian König /** 158d93f7937SChristian König * radeon_vce_fini - free memory 159d93f7937SChristian König * 160d93f7937SChristian König * @rdev: radeon_device pointer 161d93f7937SChristian König * 162d93f7937SChristian König * Last step on VCE teardown, free firmware memory 163d93f7937SChristian König */ 164d93f7937SChristian König void radeon_vce_fini(struct radeon_device *rdev) 165d93f7937SChristian König { 166b03b4e4bSChristian König if (rdev->vce.vcpu_bo == NULL) 167b03b4e4bSChristian König return; 168b03b4e4bSChristian König 169d93f7937SChristian König radeon_bo_unref(&rdev->vce.vcpu_bo); 170b03b4e4bSChristian König 171b03b4e4bSChristian König release_firmware(rdev->vce_fw); 172d93f7937SChristian König } 173d93f7937SChristian König 174d93f7937SChristian König /** 175d93f7937SChristian König * radeon_vce_suspend - unpin VCE fw memory 176d93f7937SChristian König * 177d93f7937SChristian König * @rdev: radeon_device pointer 178d93f7937SChristian König * 179d93f7937SChristian König */ 180d93f7937SChristian König int radeon_vce_suspend(struct radeon_device *rdev) 181d93f7937SChristian König { 182b03b4e4bSChristian König int i; 183d93f7937SChristian König 184d93f7937SChristian König if (rdev->vce.vcpu_bo == NULL) 185d93f7937SChristian König return 0; 186d93f7937SChristian König 187b03b4e4bSChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) 188b03b4e4bSChristian König if (atomic_read(&rdev->vce.handles[i])) 189b03b4e4bSChristian König break; 190b03b4e4bSChristian König 191b03b4e4bSChristian König if (i == RADEON_MAX_VCE_HANDLES) 192b03b4e4bSChristian König return 0; 193b03b4e4bSChristian König 194b03b4e4bSChristian König /* TODO: suspending running encoding sessions isn't supported */ 195b03b4e4bSChristian König return -EINVAL; 196d93f7937SChristian König } 197d93f7937SChristian König 198d93f7937SChristian König /** 199d93f7937SChristian König * radeon_vce_resume - pin VCE fw memory 200d93f7937SChristian König * 201d93f7937SChristian König * @rdev: radeon_device pointer 202d93f7937SChristian König * 203d93f7937SChristian König */ 204d93f7937SChristian König int radeon_vce_resume(struct radeon_device *rdev) 205d93f7937SChristian König { 206b03b4e4bSChristian König void *cpu_addr; 207d93f7937SChristian König int r; 208d93f7937SChristian König 209d93f7937SChristian König if (rdev->vce.vcpu_bo == NULL) 210d93f7937SChristian König return -EINVAL; 211d93f7937SChristian König 212d93f7937SChristian König r = radeon_bo_reserve(rdev->vce.vcpu_bo, false); 213d93f7937SChristian König if (r) { 214d93f7937SChristian König dev_err(rdev->dev, "(%d) failed to reserve VCE bo\n", r); 215d93f7937SChristian König return r; 216d93f7937SChristian König } 217d93f7937SChristian König 218b03b4e4bSChristian König r = radeon_bo_kmap(rdev->vce.vcpu_bo, &cpu_addr); 219d93f7937SChristian König if (r) { 220d93f7937SChristian König radeon_bo_unreserve(rdev->vce.vcpu_bo); 221d93f7937SChristian König dev_err(rdev->dev, "(%d) VCE map failed\n", r); 222d93f7937SChristian König return r; 223d93f7937SChristian König } 224d93f7937SChristian König 225b03b4e4bSChristian König memcpy(cpu_addr, rdev->vce_fw->data, rdev->vce_fw->size); 226b03b4e4bSChristian König 227b03b4e4bSChristian König radeon_bo_kunmap(rdev->vce.vcpu_bo); 228b03b4e4bSChristian König 229d93f7937SChristian König radeon_bo_unreserve(rdev->vce.vcpu_bo); 230d93f7937SChristian König 231d93f7937SChristian König return 0; 232d93f7937SChristian König } 233d93f7937SChristian König 234d93f7937SChristian König /** 23503afe6f6SAlex Deucher * radeon_vce_idle_work_handler - power off VCE 23603afe6f6SAlex Deucher * 23703afe6f6SAlex Deucher * @work: pointer to work structure 23803afe6f6SAlex Deucher * 23903afe6f6SAlex Deucher * power of VCE when it's not used any more 24003afe6f6SAlex Deucher */ 24103afe6f6SAlex Deucher static void radeon_vce_idle_work_handler(struct work_struct *work) 24203afe6f6SAlex Deucher { 24303afe6f6SAlex Deucher struct radeon_device *rdev = 24403afe6f6SAlex Deucher container_of(work, struct radeon_device, vce.idle_work.work); 24503afe6f6SAlex Deucher 24603afe6f6SAlex Deucher if ((radeon_fence_count_emitted(rdev, TN_RING_TYPE_VCE1_INDEX) == 0) && 24703afe6f6SAlex Deucher (radeon_fence_count_emitted(rdev, TN_RING_TYPE_VCE2_INDEX) == 0)) { 24803afe6f6SAlex Deucher if ((rdev->pm.pm_method == PM_METHOD_DPM) && rdev->pm.dpm_enabled) { 24903afe6f6SAlex Deucher radeon_dpm_enable_vce(rdev, false); 25003afe6f6SAlex Deucher } else { 25103afe6f6SAlex Deucher radeon_set_vce_clocks(rdev, 0, 0); 25203afe6f6SAlex Deucher } 25303afe6f6SAlex Deucher } else { 25403afe6f6SAlex Deucher schedule_delayed_work(&rdev->vce.idle_work, 25503afe6f6SAlex Deucher msecs_to_jiffies(VCE_IDLE_TIMEOUT_MS)); 25603afe6f6SAlex Deucher } 25703afe6f6SAlex Deucher } 25803afe6f6SAlex Deucher 25903afe6f6SAlex Deucher /** 26003afe6f6SAlex Deucher * radeon_vce_note_usage - power up VCE 26103afe6f6SAlex Deucher * 26203afe6f6SAlex Deucher * @rdev: radeon_device pointer 26303afe6f6SAlex Deucher * 26403afe6f6SAlex Deucher * Make sure VCE is powerd up when we want to use it 26503afe6f6SAlex Deucher */ 26603afe6f6SAlex Deucher void radeon_vce_note_usage(struct radeon_device *rdev) 26703afe6f6SAlex Deucher { 26803afe6f6SAlex Deucher bool streams_changed = false; 26903afe6f6SAlex Deucher bool set_clocks = !cancel_delayed_work_sync(&rdev->vce.idle_work); 27003afe6f6SAlex Deucher set_clocks &= schedule_delayed_work(&rdev->vce.idle_work, 27103afe6f6SAlex Deucher msecs_to_jiffies(VCE_IDLE_TIMEOUT_MS)); 27203afe6f6SAlex Deucher 27303afe6f6SAlex Deucher if ((rdev->pm.pm_method == PM_METHOD_DPM) && rdev->pm.dpm_enabled) { 27403afe6f6SAlex Deucher /* XXX figure out if the streams changed */ 27503afe6f6SAlex Deucher streams_changed = false; 27603afe6f6SAlex Deucher } 27703afe6f6SAlex Deucher 27803afe6f6SAlex Deucher if (set_clocks || streams_changed) { 27903afe6f6SAlex Deucher if ((rdev->pm.pm_method == PM_METHOD_DPM) && rdev->pm.dpm_enabled) { 28003afe6f6SAlex Deucher radeon_dpm_enable_vce(rdev, true); 28103afe6f6SAlex Deucher } else { 28203afe6f6SAlex Deucher radeon_set_vce_clocks(rdev, 53300, 40000); 28303afe6f6SAlex Deucher } 28403afe6f6SAlex Deucher } 28503afe6f6SAlex Deucher } 28603afe6f6SAlex Deucher 28703afe6f6SAlex Deucher /** 288d93f7937SChristian König * radeon_vce_free_handles - free still open VCE handles 289d93f7937SChristian König * 290d93f7937SChristian König * @rdev: radeon_device pointer 291d93f7937SChristian König * @filp: drm file pointer 292d93f7937SChristian König * 293d93f7937SChristian König * Close all VCE handles still open by this file pointer 294d93f7937SChristian König */ 295d93f7937SChristian König void radeon_vce_free_handles(struct radeon_device *rdev, struct drm_file *filp) 296d93f7937SChristian König { 297d93f7937SChristian König int i, r; 298d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 299d93f7937SChristian König uint32_t handle = atomic_read(&rdev->vce.handles[i]); 300d93f7937SChristian König if (!handle || rdev->vce.filp[i] != filp) 301d93f7937SChristian König continue; 302d93f7937SChristian König 30303afe6f6SAlex Deucher radeon_vce_note_usage(rdev); 30403afe6f6SAlex Deucher 305d93f7937SChristian König r = radeon_vce_get_destroy_msg(rdev, TN_RING_TYPE_VCE1_INDEX, 306d93f7937SChristian König handle, NULL); 307d93f7937SChristian König if (r) 308d93f7937SChristian König DRM_ERROR("Error destroying VCE handle (%d)!\n", r); 309d93f7937SChristian König 310d93f7937SChristian König rdev->vce.filp[i] = NULL; 311d93f7937SChristian König atomic_set(&rdev->vce.handles[i], 0); 312d93f7937SChristian König } 313d93f7937SChristian König } 314d93f7937SChristian König 315d93f7937SChristian König /** 316d93f7937SChristian König * radeon_vce_get_create_msg - generate a VCE create msg 317d93f7937SChristian König * 318d93f7937SChristian König * @rdev: radeon_device pointer 319d93f7937SChristian König * @ring: ring we should submit the msg to 320d93f7937SChristian König * @handle: VCE session handle to use 321d93f7937SChristian König * @fence: optional fence to return 322d93f7937SChristian König * 323d93f7937SChristian König * Open up a stream for HW test 324d93f7937SChristian König */ 325d93f7937SChristian König int radeon_vce_get_create_msg(struct radeon_device *rdev, int ring, 326d93f7937SChristian König uint32_t handle, struct radeon_fence **fence) 327d93f7937SChristian König { 328d93f7937SChristian König const unsigned ib_size_dw = 1024; 329d93f7937SChristian König struct radeon_ib ib; 330d93f7937SChristian König uint64_t dummy; 331d93f7937SChristian König int i, r; 332d93f7937SChristian König 333d93f7937SChristian König r = radeon_ib_get(rdev, ring, &ib, NULL, ib_size_dw * 4); 334d93f7937SChristian König if (r) { 335d93f7937SChristian König DRM_ERROR("radeon: failed to get ib (%d).\n", r); 336d93f7937SChristian König return r; 337d93f7937SChristian König } 338d93f7937SChristian König 339d93f7937SChristian König dummy = ib.gpu_addr + 1024; 340d93f7937SChristian König 341d93f7937SChristian König /* stitch together an VCE create msg */ 342d93f7937SChristian König ib.length_dw = 0; 343d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000c; /* len */ 344d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; /* session cmd */ 345d93f7937SChristian König ib.ptr[ib.length_dw++] = handle; 346d93f7937SChristian König 347d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000030; /* len */ 348d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x01000001; /* create cmd */ 349d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000000; 350d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000042; 351d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000a; 352d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; 353d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000080; 354d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000060; 355d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000100; 356d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000100; 357d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000c; 358d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000000; 359d93f7937SChristian König 360d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000014; /* len */ 361d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x05000005; /* feedback buffer */ 362d93f7937SChristian König ib.ptr[ib.length_dw++] = upper_32_bits(dummy); 363d93f7937SChristian König ib.ptr[ib.length_dw++] = dummy; 364d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; 365d93f7937SChristian König 366d93f7937SChristian König for (i = ib.length_dw; i < ib_size_dw; ++i) 367d93f7937SChristian König ib.ptr[i] = 0x0; 368d93f7937SChristian König 369d93f7937SChristian König r = radeon_ib_schedule(rdev, &ib, NULL); 370d93f7937SChristian König if (r) { 371d93f7937SChristian König DRM_ERROR("radeon: failed to schedule ib (%d).\n", r); 372d93f7937SChristian König } 373d93f7937SChristian König 374d93f7937SChristian König if (fence) 375d93f7937SChristian König *fence = radeon_fence_ref(ib.fence); 376d93f7937SChristian König 377d93f7937SChristian König radeon_ib_free(rdev, &ib); 378d93f7937SChristian König 379d93f7937SChristian König return r; 380d93f7937SChristian König } 381d93f7937SChristian König 382d93f7937SChristian König /** 383d93f7937SChristian König * radeon_vce_get_destroy_msg - generate a VCE destroy msg 384d93f7937SChristian König * 385d93f7937SChristian König * @rdev: radeon_device pointer 386d93f7937SChristian König * @ring: ring we should submit the msg to 387d93f7937SChristian König * @handle: VCE session handle to use 388d93f7937SChristian König * @fence: optional fence to return 389d93f7937SChristian König * 390d93f7937SChristian König * Close up a stream for HW test or if userspace failed to do so 391d93f7937SChristian König */ 392d93f7937SChristian König int radeon_vce_get_destroy_msg(struct radeon_device *rdev, int ring, 393d93f7937SChristian König uint32_t handle, struct radeon_fence **fence) 394d93f7937SChristian König { 395d93f7937SChristian König const unsigned ib_size_dw = 1024; 396d93f7937SChristian König struct radeon_ib ib; 397d93f7937SChristian König uint64_t dummy; 398d93f7937SChristian König int i, r; 399d93f7937SChristian König 400d93f7937SChristian König r = radeon_ib_get(rdev, ring, &ib, NULL, ib_size_dw * 4); 401d93f7937SChristian König if (r) { 402d93f7937SChristian König DRM_ERROR("radeon: failed to get ib (%d).\n", r); 403d93f7937SChristian König return r; 404d93f7937SChristian König } 405d93f7937SChristian König 406d93f7937SChristian König dummy = ib.gpu_addr + 1024; 407d93f7937SChristian König 408d93f7937SChristian König /* stitch together an VCE destroy msg */ 409d93f7937SChristian König ib.length_dw = 0; 410d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x0000000c; /* len */ 411d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; /* session cmd */ 412d93f7937SChristian König ib.ptr[ib.length_dw++] = handle; 413d93f7937SChristian König 414d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000014; /* len */ 415d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x05000005; /* feedback buffer */ 416d93f7937SChristian König ib.ptr[ib.length_dw++] = upper_32_bits(dummy); 417d93f7937SChristian König ib.ptr[ib.length_dw++] = dummy; 418d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000001; 419d93f7937SChristian König 420d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x00000008; /* len */ 421d93f7937SChristian König ib.ptr[ib.length_dw++] = 0x02000001; /* destroy cmd */ 422d93f7937SChristian König 423d93f7937SChristian König for (i = ib.length_dw; i < ib_size_dw; ++i) 424d93f7937SChristian König ib.ptr[i] = 0x0; 425d93f7937SChristian König 426d93f7937SChristian König r = radeon_ib_schedule(rdev, &ib, NULL); 427d93f7937SChristian König if (r) { 428d93f7937SChristian König DRM_ERROR("radeon: failed to schedule ib (%d).\n", r); 429d93f7937SChristian König } 430d93f7937SChristian König 431d93f7937SChristian König if (fence) 432d93f7937SChristian König *fence = radeon_fence_ref(ib.fence); 433d93f7937SChristian König 434d93f7937SChristian König radeon_ib_free(rdev, &ib); 435d93f7937SChristian König 436d93f7937SChristian König return r; 437d93f7937SChristian König } 438d93f7937SChristian König 439d93f7937SChristian König /** 440d93f7937SChristian König * radeon_vce_cs_reloc - command submission relocation 441d93f7937SChristian König * 442d93f7937SChristian König * @p: parser context 443d93f7937SChristian König * @lo: address of lower dword 444d93f7937SChristian König * @hi: address of higher dword 445d93f7937SChristian König * 446d93f7937SChristian König * Patch relocation inside command stream with real buffer address 447d93f7937SChristian König */ 448d93f7937SChristian König int radeon_vce_cs_reloc(struct radeon_cs_parser *p, int lo, int hi) 449d93f7937SChristian König { 450d93f7937SChristian König struct radeon_cs_chunk *relocs_chunk; 451d93f7937SChristian König uint64_t offset; 452d93f7937SChristian König unsigned idx; 453d93f7937SChristian König 454d93f7937SChristian König relocs_chunk = &p->chunks[p->chunk_relocs_idx]; 455d93f7937SChristian König offset = radeon_get_ib_value(p, lo); 456d93f7937SChristian König idx = radeon_get_ib_value(p, hi); 457d93f7937SChristian König 458d93f7937SChristian König if (idx >= relocs_chunk->length_dw) { 459d93f7937SChristian König DRM_ERROR("Relocs at %d after relocations chunk end %d !\n", 460d93f7937SChristian König idx, relocs_chunk->length_dw); 461d93f7937SChristian König return -EINVAL; 462d93f7937SChristian König } 463d93f7937SChristian König 464df0af440SChristian König offset += p->relocs_ptr[(idx / 4)]->gpu_offset; 465d93f7937SChristian König 466d93f7937SChristian König p->ib.ptr[lo] = offset & 0xFFFFFFFF; 467d93f7937SChristian König p->ib.ptr[hi] = offset >> 32; 468d93f7937SChristian König 469d93f7937SChristian König return 0; 470d93f7937SChristian König } 471d93f7937SChristian König 472d93f7937SChristian König /** 473d93f7937SChristian König * radeon_vce_cs_parse - parse and validate the command stream 474d93f7937SChristian König * 475d93f7937SChristian König * @p: parser context 476d93f7937SChristian König * 477d93f7937SChristian König */ 478d93f7937SChristian König int radeon_vce_cs_parse(struct radeon_cs_parser *p) 479d93f7937SChristian König { 480d93f7937SChristian König uint32_t handle = 0; 481d93f7937SChristian König bool destroy = false; 482d93f7937SChristian König int i, r; 483d93f7937SChristian König 484d93f7937SChristian König while (p->idx < p->chunks[p->chunk_ib_idx].length_dw) { 485d93f7937SChristian König uint32_t len = radeon_get_ib_value(p, p->idx); 486d93f7937SChristian König uint32_t cmd = radeon_get_ib_value(p, p->idx + 1); 487d93f7937SChristian König 488d93f7937SChristian König if ((len < 8) || (len & 3)) { 489d93f7937SChristian König DRM_ERROR("invalid VCE command length (%d)!\n", len); 490d93f7937SChristian König return -EINVAL; 491d93f7937SChristian König } 492d93f7937SChristian König 493d93f7937SChristian König switch (cmd) { 494d93f7937SChristian König case 0x00000001: // session 495d93f7937SChristian König handle = radeon_get_ib_value(p, p->idx + 2); 496d93f7937SChristian König break; 497d93f7937SChristian König 498d93f7937SChristian König case 0x00000002: // task info 499d93f7937SChristian König case 0x01000001: // create 500d93f7937SChristian König case 0x04000001: // config extension 501d93f7937SChristian König case 0x04000002: // pic control 502d93f7937SChristian König case 0x04000005: // rate control 503d93f7937SChristian König case 0x04000007: // motion estimation 504d93f7937SChristian König case 0x04000008: // rdo 505d93f7937SChristian König break; 506d93f7937SChristian König 507d93f7937SChristian König case 0x03000001: // encode 508d93f7937SChristian König r = radeon_vce_cs_reloc(p, p->idx + 10, p->idx + 9); 509d93f7937SChristian König if (r) 510d93f7937SChristian König return r; 511d93f7937SChristian König 512d93f7937SChristian König r = radeon_vce_cs_reloc(p, p->idx + 12, p->idx + 11); 513d93f7937SChristian König if (r) 514d93f7937SChristian König return r; 515d93f7937SChristian König break; 516d93f7937SChristian König 517d93f7937SChristian König case 0x02000001: // destroy 518d93f7937SChristian König destroy = true; 519d93f7937SChristian König break; 520d93f7937SChristian König 521d93f7937SChristian König case 0x05000001: // context buffer 522d93f7937SChristian König case 0x05000004: // video bitstream buffer 523d93f7937SChristian König case 0x05000005: // feedback buffer 524d93f7937SChristian König r = radeon_vce_cs_reloc(p, p->idx + 3, p->idx + 2); 525d93f7937SChristian König if (r) 526d93f7937SChristian König return r; 527d93f7937SChristian König break; 528d93f7937SChristian König 529d93f7937SChristian König default: 530d93f7937SChristian König DRM_ERROR("invalid VCE command (0x%x)!\n", cmd); 531d93f7937SChristian König return -EINVAL; 532d93f7937SChristian König } 533d93f7937SChristian König 534d93f7937SChristian König p->idx += len / 4; 535d93f7937SChristian König } 536d93f7937SChristian König 537d93f7937SChristian König if (destroy) { 538d93f7937SChristian König /* IB contains a destroy msg, free the handle */ 539d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) 540d93f7937SChristian König atomic_cmpxchg(&p->rdev->vce.handles[i], handle, 0); 541d93f7937SChristian König 542d93f7937SChristian König return 0; 543d93f7937SChristian König } 544d93f7937SChristian König 545d93f7937SChristian König /* create or encode, validate the handle */ 546d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 547d93f7937SChristian König if (atomic_read(&p->rdev->vce.handles[i]) == handle) 548d93f7937SChristian König return 0; 549d93f7937SChristian König } 550d93f7937SChristian König 551d93f7937SChristian König /* handle not found try to alloc a new one */ 552d93f7937SChristian König for (i = 0; i < RADEON_MAX_VCE_HANDLES; ++i) { 553d93f7937SChristian König if (!atomic_cmpxchg(&p->rdev->vce.handles[i], 0, handle)) { 554d93f7937SChristian König p->rdev->vce.filp[i] = p->filp; 555d93f7937SChristian König return 0; 556d93f7937SChristian König } 557d93f7937SChristian König } 558d93f7937SChristian König 559d93f7937SChristian König DRM_ERROR("No more free VCE handles!\n"); 560d93f7937SChristian König return -EINVAL; 561d93f7937SChristian König } 562d93f7937SChristian König 563d93f7937SChristian König /** 564d93f7937SChristian König * radeon_vce_semaphore_emit - emit a semaphore command 565d93f7937SChristian König * 566d93f7937SChristian König * @rdev: radeon_device pointer 567d93f7937SChristian König * @ring: engine to use 568d93f7937SChristian König * @semaphore: address of semaphore 569d93f7937SChristian König * @emit_wait: true=emit wait, false=emit signal 570d93f7937SChristian König * 571d93f7937SChristian König */ 572d93f7937SChristian König bool radeon_vce_semaphore_emit(struct radeon_device *rdev, 573d93f7937SChristian König struct radeon_ring *ring, 574d93f7937SChristian König struct radeon_semaphore *semaphore, 575d93f7937SChristian König bool emit_wait) 576d93f7937SChristian König { 577d93f7937SChristian König uint64_t addr = semaphore->gpu_addr; 578d93f7937SChristian König 579d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_SEMAPHORE); 580d93f7937SChristian König radeon_ring_write(ring, (addr >> 3) & 0x000FFFFF); 581d93f7937SChristian König radeon_ring_write(ring, (addr >> 23) & 0x000FFFFF); 582d93f7937SChristian König radeon_ring_write(ring, 0x01003000 | (emit_wait ? 1 : 0)); 583d93f7937SChristian König if (!emit_wait) 584d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_END); 585d93f7937SChristian König 586d93f7937SChristian König return true; 587d93f7937SChristian König } 588d93f7937SChristian König 589d93f7937SChristian König /** 590d93f7937SChristian König * radeon_vce_ib_execute - execute indirect buffer 591d93f7937SChristian König * 592d93f7937SChristian König * @rdev: radeon_device pointer 593d93f7937SChristian König * @ib: the IB to execute 594d93f7937SChristian König * 595d93f7937SChristian König */ 596d93f7937SChristian König void radeon_vce_ib_execute(struct radeon_device *rdev, struct radeon_ib *ib) 597d93f7937SChristian König { 598d93f7937SChristian König struct radeon_ring *ring = &rdev->ring[ib->ring]; 599d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_IB); 600d93f7937SChristian König radeon_ring_write(ring, ib->gpu_addr); 601d93f7937SChristian König radeon_ring_write(ring, upper_32_bits(ib->gpu_addr)); 602d93f7937SChristian König radeon_ring_write(ring, ib->length_dw); 603d93f7937SChristian König } 604d93f7937SChristian König 605d93f7937SChristian König /** 606d93f7937SChristian König * radeon_vce_fence_emit - add a fence command to the ring 607d93f7937SChristian König * 608d93f7937SChristian König * @rdev: radeon_device pointer 609d93f7937SChristian König * @fence: the fence 610d93f7937SChristian König * 611d93f7937SChristian König */ 612d93f7937SChristian König void radeon_vce_fence_emit(struct radeon_device *rdev, 613d93f7937SChristian König struct radeon_fence *fence) 614d93f7937SChristian König { 615d93f7937SChristian König struct radeon_ring *ring = &rdev->ring[fence->ring]; 616*681941c1SChristoph Jaeger uint64_t addr = rdev->fence_drv[fence->ring].gpu_addr; 617d93f7937SChristian König 618d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_FENCE); 619d93f7937SChristian König radeon_ring_write(ring, addr); 620d93f7937SChristian König radeon_ring_write(ring, upper_32_bits(addr)); 621d93f7937SChristian König radeon_ring_write(ring, fence->seq); 622d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_TRAP); 623d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_END); 624d93f7937SChristian König } 625d93f7937SChristian König 626d93f7937SChristian König /** 627d93f7937SChristian König * radeon_vce_ring_test - test if VCE ring is working 628d93f7937SChristian König * 629d93f7937SChristian König * @rdev: radeon_device pointer 630d93f7937SChristian König * @ring: the engine to test on 631d93f7937SChristian König * 632d93f7937SChristian König */ 633d93f7937SChristian König int radeon_vce_ring_test(struct radeon_device *rdev, struct radeon_ring *ring) 634d93f7937SChristian König { 635d93f7937SChristian König uint32_t rptr = vce_v1_0_get_rptr(rdev, ring); 636d93f7937SChristian König unsigned i; 637d93f7937SChristian König int r; 638d93f7937SChristian König 639d93f7937SChristian König r = radeon_ring_lock(rdev, ring, 16); 640d93f7937SChristian König if (r) { 641d93f7937SChristian König DRM_ERROR("radeon: vce failed to lock ring %d (%d).\n", 642d93f7937SChristian König ring->idx, r); 643d93f7937SChristian König return r; 644d93f7937SChristian König } 645d93f7937SChristian König radeon_ring_write(ring, VCE_CMD_END); 646d93f7937SChristian König radeon_ring_unlock_commit(rdev, ring); 647d93f7937SChristian König 648d93f7937SChristian König for (i = 0; i < rdev->usec_timeout; i++) { 649d93f7937SChristian König if (vce_v1_0_get_rptr(rdev, ring) != rptr) 650d93f7937SChristian König break; 651d93f7937SChristian König DRM_UDELAY(1); 652d93f7937SChristian König } 653d93f7937SChristian König 654d93f7937SChristian König if (i < rdev->usec_timeout) { 655d93f7937SChristian König DRM_INFO("ring test on %d succeeded in %d usecs\n", 656d93f7937SChristian König ring->idx, i); 657d93f7937SChristian König } else { 658d93f7937SChristian König DRM_ERROR("radeon: ring %d test failed\n", 659d93f7937SChristian König ring->idx); 660d93f7937SChristian König r = -ETIMEDOUT; 661d93f7937SChristian König } 662d93f7937SChristian König 663d93f7937SChristian König return r; 664d93f7937SChristian König } 665d93f7937SChristian König 666d93f7937SChristian König /** 667d93f7937SChristian König * radeon_vce_ib_test - test if VCE IBs are working 668d93f7937SChristian König * 669d93f7937SChristian König * @rdev: radeon_device pointer 670d93f7937SChristian König * @ring: the engine to test on 671d93f7937SChristian König * 672d93f7937SChristian König */ 673d93f7937SChristian König int radeon_vce_ib_test(struct radeon_device *rdev, struct radeon_ring *ring) 674d93f7937SChristian König { 675d93f7937SChristian König struct radeon_fence *fence = NULL; 676d93f7937SChristian König int r; 677d93f7937SChristian König 678d93f7937SChristian König r = radeon_vce_get_create_msg(rdev, ring->idx, 1, NULL); 679d93f7937SChristian König if (r) { 680d93f7937SChristian König DRM_ERROR("radeon: failed to get create msg (%d).\n", r); 681d93f7937SChristian König goto error; 682d93f7937SChristian König } 683d93f7937SChristian König 684d93f7937SChristian König r = radeon_vce_get_destroy_msg(rdev, ring->idx, 1, &fence); 685d93f7937SChristian König if (r) { 686d93f7937SChristian König DRM_ERROR("radeon: failed to get destroy ib (%d).\n", r); 687d93f7937SChristian König goto error; 688d93f7937SChristian König } 689d93f7937SChristian König 690d93f7937SChristian König r = radeon_fence_wait(fence, false); 691d93f7937SChristian König if (r) { 692d93f7937SChristian König DRM_ERROR("radeon: fence wait failed (%d).\n", r); 693d93f7937SChristian König } else { 694d93f7937SChristian König DRM_INFO("ib test on ring %d succeeded\n", ring->idx); 695d93f7937SChristian König } 696d93f7937SChristian König error: 697d93f7937SChristian König radeon_fence_unref(&fence); 698d93f7937SChristian König return r; 699d93f7937SChristian König } 700