1771fe6b9SJerome Glisse /* 2771fe6b9SJerome Glisse * Copyright 2008 Advanced Micro Devices, Inc. 3771fe6b9SJerome Glisse * Copyright 2008 Red Hat Inc. 4771fe6b9SJerome Glisse * Copyright 2009 Jerome Glisse. 5771fe6b9SJerome Glisse * 6771fe6b9SJerome Glisse * Permission is hereby granted, free of charge, to any person obtaining a 7771fe6b9SJerome Glisse * copy of this software and associated documentation files (the "Software"), 8771fe6b9SJerome Glisse * to deal in the Software without restriction, including without limitation 9771fe6b9SJerome Glisse * the rights to use, copy, modify, merge, publish, distribute, sublicense, 10771fe6b9SJerome Glisse * and/or sell copies of the Software, and to permit persons to whom the 11771fe6b9SJerome Glisse * Software is furnished to do so, subject to the following conditions: 12771fe6b9SJerome Glisse * 13771fe6b9SJerome Glisse * The above copyright notice and this permission notice shall be included in 14771fe6b9SJerome Glisse * all copies or substantial portions of the Software. 15771fe6b9SJerome Glisse * 16771fe6b9SJerome Glisse * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR 17771fe6b9SJerome Glisse * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, 18771fe6b9SJerome Glisse * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL 19771fe6b9SJerome Glisse * THE COPYRIGHT HOLDER(S) OR AUTHOR(S) BE LIABLE FOR ANY CLAIM, DAMAGES OR 20771fe6b9SJerome Glisse * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, 21771fe6b9SJerome Glisse * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR 22771fe6b9SJerome Glisse * OTHER DEALINGS IN THE SOFTWARE. 23771fe6b9SJerome Glisse * 24771fe6b9SJerome Glisse * Authors: Dave Airlie 25771fe6b9SJerome Glisse * Alex Deucher 26771fe6b9SJerome Glisse * Jerome Glisse 27771fe6b9SJerome Glisse */ 28771fe6b9SJerome Glisse #include <linux/seq_file.h> 29771fe6b9SJerome Glisse #include "drmP.h" 30771fe6b9SJerome Glisse #include "drm.h" 31771fe6b9SJerome Glisse #include "radeon_drm.h" 32771fe6b9SJerome Glisse #include "radeon_microcode.h" 33771fe6b9SJerome Glisse #include "radeon_reg.h" 34771fe6b9SJerome Glisse #include "radeon.h" 35771fe6b9SJerome Glisse 36771fe6b9SJerome Glisse /* This files gather functions specifics to: 37771fe6b9SJerome Glisse * r100,rv100,rs100,rv200,rs200,r200,rv250,rs300,rv280 38771fe6b9SJerome Glisse * 39771fe6b9SJerome Glisse * Some of these functions might be used by newer ASICs. 40771fe6b9SJerome Glisse */ 41771fe6b9SJerome Glisse void r100_hdp_reset(struct radeon_device *rdev); 42771fe6b9SJerome Glisse void r100_gpu_init(struct radeon_device *rdev); 43771fe6b9SJerome Glisse int r100_gui_wait_for_idle(struct radeon_device *rdev); 44771fe6b9SJerome Glisse int r100_mc_wait_for_idle(struct radeon_device *rdev); 45771fe6b9SJerome Glisse void r100_gpu_wait_for_vsync(struct radeon_device *rdev); 46771fe6b9SJerome Glisse void r100_gpu_wait_for_vsync2(struct radeon_device *rdev); 47771fe6b9SJerome Glisse int r100_debugfs_mc_info_init(struct radeon_device *rdev); 48771fe6b9SJerome Glisse 49771fe6b9SJerome Glisse 50771fe6b9SJerome Glisse /* 51771fe6b9SJerome Glisse * PCI GART 52771fe6b9SJerome Glisse */ 53771fe6b9SJerome Glisse void r100_pci_gart_tlb_flush(struct radeon_device *rdev) 54771fe6b9SJerome Glisse { 55771fe6b9SJerome Glisse /* TODO: can we do somethings here ? */ 56771fe6b9SJerome Glisse /* It seems hw only cache one entry so we should discard this 57771fe6b9SJerome Glisse * entry otherwise if first GPU GART read hit this entry it 58771fe6b9SJerome Glisse * could end up in wrong address. */ 59771fe6b9SJerome Glisse } 60771fe6b9SJerome Glisse 61771fe6b9SJerome Glisse int r100_pci_gart_enable(struct radeon_device *rdev) 62771fe6b9SJerome Glisse { 63771fe6b9SJerome Glisse uint32_t tmp; 64771fe6b9SJerome Glisse int r; 65771fe6b9SJerome Glisse 66771fe6b9SJerome Glisse /* Initialize common gart structure */ 67771fe6b9SJerome Glisse r = radeon_gart_init(rdev); 68771fe6b9SJerome Glisse if (r) { 69771fe6b9SJerome Glisse return r; 70771fe6b9SJerome Glisse } 71771fe6b9SJerome Glisse if (rdev->gart.table.ram.ptr == NULL) { 72771fe6b9SJerome Glisse rdev->gart.table_size = rdev->gart.num_gpu_pages * 4; 73771fe6b9SJerome Glisse r = radeon_gart_table_ram_alloc(rdev); 74771fe6b9SJerome Glisse if (r) { 75771fe6b9SJerome Glisse return r; 76771fe6b9SJerome Glisse } 77771fe6b9SJerome Glisse } 78771fe6b9SJerome Glisse /* discard memory request outside of configured range */ 79771fe6b9SJerome Glisse tmp = RREG32(RADEON_AIC_CNTL) | RADEON_DIS_OUT_OF_PCI_GART_ACCESS; 80771fe6b9SJerome Glisse WREG32(RADEON_AIC_CNTL, tmp); 81771fe6b9SJerome Glisse /* set address range for PCI address translate */ 82771fe6b9SJerome Glisse WREG32(RADEON_AIC_LO_ADDR, rdev->mc.gtt_location); 83771fe6b9SJerome Glisse tmp = rdev->mc.gtt_location + rdev->mc.gtt_size - 1; 84771fe6b9SJerome Glisse WREG32(RADEON_AIC_HI_ADDR, tmp); 85771fe6b9SJerome Glisse /* Enable bus mastering */ 86771fe6b9SJerome Glisse tmp = RREG32(RADEON_BUS_CNTL) & ~RADEON_BUS_MASTER_DIS; 87771fe6b9SJerome Glisse WREG32(RADEON_BUS_CNTL, tmp); 88771fe6b9SJerome Glisse /* set PCI GART page-table base address */ 89771fe6b9SJerome Glisse WREG32(RADEON_AIC_PT_BASE, rdev->gart.table_addr); 90771fe6b9SJerome Glisse tmp = RREG32(RADEON_AIC_CNTL) | RADEON_PCIGART_TRANSLATE_EN; 91771fe6b9SJerome Glisse WREG32(RADEON_AIC_CNTL, tmp); 92771fe6b9SJerome Glisse r100_pci_gart_tlb_flush(rdev); 93771fe6b9SJerome Glisse rdev->gart.ready = true; 94771fe6b9SJerome Glisse return 0; 95771fe6b9SJerome Glisse } 96771fe6b9SJerome Glisse 97771fe6b9SJerome Glisse void r100_pci_gart_disable(struct radeon_device *rdev) 98771fe6b9SJerome Glisse { 99771fe6b9SJerome Glisse uint32_t tmp; 100771fe6b9SJerome Glisse 101771fe6b9SJerome Glisse /* discard memory request outside of configured range */ 102771fe6b9SJerome Glisse tmp = RREG32(RADEON_AIC_CNTL) | RADEON_DIS_OUT_OF_PCI_GART_ACCESS; 103771fe6b9SJerome Glisse WREG32(RADEON_AIC_CNTL, tmp & ~RADEON_PCIGART_TRANSLATE_EN); 104771fe6b9SJerome Glisse WREG32(RADEON_AIC_LO_ADDR, 0); 105771fe6b9SJerome Glisse WREG32(RADEON_AIC_HI_ADDR, 0); 106771fe6b9SJerome Glisse } 107771fe6b9SJerome Glisse 108771fe6b9SJerome Glisse int r100_pci_gart_set_page(struct radeon_device *rdev, int i, uint64_t addr) 109771fe6b9SJerome Glisse { 110771fe6b9SJerome Glisse if (i < 0 || i > rdev->gart.num_gpu_pages) { 111771fe6b9SJerome Glisse return -EINVAL; 112771fe6b9SJerome Glisse } 113*ed10f95dSDave Airlie rdev->gart.table.ram.ptr[i] = cpu_to_le32(lower_32_bits(addr)); 114771fe6b9SJerome Glisse return 0; 115771fe6b9SJerome Glisse } 116771fe6b9SJerome Glisse 117771fe6b9SJerome Glisse int r100_gart_enable(struct radeon_device *rdev) 118771fe6b9SJerome Glisse { 119771fe6b9SJerome Glisse if (rdev->flags & RADEON_IS_AGP) { 120771fe6b9SJerome Glisse r100_pci_gart_disable(rdev); 121771fe6b9SJerome Glisse return 0; 122771fe6b9SJerome Glisse } 123771fe6b9SJerome Glisse return r100_pci_gart_enable(rdev); 124771fe6b9SJerome Glisse } 125771fe6b9SJerome Glisse 126771fe6b9SJerome Glisse 127771fe6b9SJerome Glisse /* 128771fe6b9SJerome Glisse * MC 129771fe6b9SJerome Glisse */ 130771fe6b9SJerome Glisse void r100_mc_disable_clients(struct radeon_device *rdev) 131771fe6b9SJerome Glisse { 132771fe6b9SJerome Glisse uint32_t ov0_scale_cntl, crtc_ext_cntl, crtc_gen_cntl, crtc2_gen_cntl; 133771fe6b9SJerome Glisse 134771fe6b9SJerome Glisse /* FIXME: is this function correct for rs100,rs200,rs300 ? */ 135771fe6b9SJerome Glisse if (r100_gui_wait_for_idle(rdev)) { 136771fe6b9SJerome Glisse printk(KERN_WARNING "Failed to wait GUI idle while " 137771fe6b9SJerome Glisse "programming pipes. Bad things might happen.\n"); 138771fe6b9SJerome Glisse } 139771fe6b9SJerome Glisse 140771fe6b9SJerome Glisse /* stop display and memory access */ 141771fe6b9SJerome Glisse ov0_scale_cntl = RREG32(RADEON_OV0_SCALE_CNTL); 142771fe6b9SJerome Glisse WREG32(RADEON_OV0_SCALE_CNTL, ov0_scale_cntl & ~RADEON_SCALER_ENABLE); 143771fe6b9SJerome Glisse crtc_ext_cntl = RREG32(RADEON_CRTC_EXT_CNTL); 144771fe6b9SJerome Glisse WREG32(RADEON_CRTC_EXT_CNTL, crtc_ext_cntl | RADEON_CRTC_DISPLAY_DIS); 145771fe6b9SJerome Glisse crtc_gen_cntl = RREG32(RADEON_CRTC_GEN_CNTL); 146771fe6b9SJerome Glisse 147771fe6b9SJerome Glisse r100_gpu_wait_for_vsync(rdev); 148771fe6b9SJerome Glisse 149771fe6b9SJerome Glisse WREG32(RADEON_CRTC_GEN_CNTL, 150771fe6b9SJerome Glisse (crtc_gen_cntl & ~(RADEON_CRTC_CUR_EN | RADEON_CRTC_ICON_EN)) | 151771fe6b9SJerome Glisse RADEON_CRTC_DISP_REQ_EN_B | RADEON_CRTC_EXT_DISP_EN); 152771fe6b9SJerome Glisse 153771fe6b9SJerome Glisse if (!(rdev->flags & RADEON_SINGLE_CRTC)) { 154771fe6b9SJerome Glisse crtc2_gen_cntl = RREG32(RADEON_CRTC2_GEN_CNTL); 155771fe6b9SJerome Glisse 156771fe6b9SJerome Glisse r100_gpu_wait_for_vsync2(rdev); 157771fe6b9SJerome Glisse WREG32(RADEON_CRTC2_GEN_CNTL, 158771fe6b9SJerome Glisse (crtc2_gen_cntl & 159771fe6b9SJerome Glisse ~(RADEON_CRTC2_CUR_EN | RADEON_CRTC2_ICON_EN)) | 160771fe6b9SJerome Glisse RADEON_CRTC2_DISP_REQ_EN_B); 161771fe6b9SJerome Glisse } 162771fe6b9SJerome Glisse 163771fe6b9SJerome Glisse udelay(500); 164771fe6b9SJerome Glisse } 165771fe6b9SJerome Glisse 166771fe6b9SJerome Glisse void r100_mc_setup(struct radeon_device *rdev) 167771fe6b9SJerome Glisse { 168771fe6b9SJerome Glisse uint32_t tmp; 169771fe6b9SJerome Glisse int r; 170771fe6b9SJerome Glisse 171771fe6b9SJerome Glisse r = r100_debugfs_mc_info_init(rdev); 172771fe6b9SJerome Glisse if (r) { 173771fe6b9SJerome Glisse DRM_ERROR("Failed to register debugfs file for R100 MC !\n"); 174771fe6b9SJerome Glisse } 175771fe6b9SJerome Glisse /* Write VRAM size in case we are limiting it */ 176771fe6b9SJerome Glisse WREG32(RADEON_CONFIG_MEMSIZE, rdev->mc.vram_size); 177771fe6b9SJerome Glisse tmp = rdev->mc.vram_location + rdev->mc.vram_size - 1; 178771fe6b9SJerome Glisse tmp = REG_SET(RADEON_MC_FB_TOP, tmp >> 16); 179771fe6b9SJerome Glisse tmp |= REG_SET(RADEON_MC_FB_START, rdev->mc.vram_location >> 16); 180771fe6b9SJerome Glisse WREG32(RADEON_MC_FB_LOCATION, tmp); 181771fe6b9SJerome Glisse 182771fe6b9SJerome Glisse /* Enable bus mastering */ 183771fe6b9SJerome Glisse tmp = RREG32(RADEON_BUS_CNTL) & ~RADEON_BUS_MASTER_DIS; 184771fe6b9SJerome Glisse WREG32(RADEON_BUS_CNTL, tmp); 185771fe6b9SJerome Glisse 186771fe6b9SJerome Glisse if (rdev->flags & RADEON_IS_AGP) { 187771fe6b9SJerome Glisse tmp = rdev->mc.gtt_location + rdev->mc.gtt_size - 1; 188771fe6b9SJerome Glisse tmp = REG_SET(RADEON_MC_AGP_TOP, tmp >> 16); 189771fe6b9SJerome Glisse tmp |= REG_SET(RADEON_MC_AGP_START, rdev->mc.gtt_location >> 16); 190771fe6b9SJerome Glisse WREG32(RADEON_MC_AGP_LOCATION, tmp); 191771fe6b9SJerome Glisse WREG32(RADEON_AGP_BASE, rdev->mc.agp_base); 192771fe6b9SJerome Glisse } else { 193771fe6b9SJerome Glisse WREG32(RADEON_MC_AGP_LOCATION, 0x0FFFFFFF); 194771fe6b9SJerome Glisse WREG32(RADEON_AGP_BASE, 0); 195771fe6b9SJerome Glisse } 196771fe6b9SJerome Glisse 197771fe6b9SJerome Glisse tmp = RREG32(RADEON_HOST_PATH_CNTL) & RADEON_HDP_APER_CNTL; 198771fe6b9SJerome Glisse tmp |= (7 << 28); 199771fe6b9SJerome Glisse WREG32(RADEON_HOST_PATH_CNTL, tmp | RADEON_HDP_SOFT_RESET | RADEON_HDP_READ_BUFFER_INVALIDATE); 200771fe6b9SJerome Glisse (void)RREG32(RADEON_HOST_PATH_CNTL); 201771fe6b9SJerome Glisse WREG32(RADEON_HOST_PATH_CNTL, tmp); 202771fe6b9SJerome Glisse (void)RREG32(RADEON_HOST_PATH_CNTL); 203771fe6b9SJerome Glisse } 204771fe6b9SJerome Glisse 205771fe6b9SJerome Glisse int r100_mc_init(struct radeon_device *rdev) 206771fe6b9SJerome Glisse { 207771fe6b9SJerome Glisse int r; 208771fe6b9SJerome Glisse 209771fe6b9SJerome Glisse if (r100_debugfs_rbbm_init(rdev)) { 210771fe6b9SJerome Glisse DRM_ERROR("Failed to register debugfs file for RBBM !\n"); 211771fe6b9SJerome Glisse } 212771fe6b9SJerome Glisse 213771fe6b9SJerome Glisse r100_gpu_init(rdev); 214771fe6b9SJerome Glisse /* Disable gart which also disable out of gart access */ 215771fe6b9SJerome Glisse r100_pci_gart_disable(rdev); 216771fe6b9SJerome Glisse 217771fe6b9SJerome Glisse /* Setup GPU memory space */ 218771fe6b9SJerome Glisse rdev->mc.vram_location = 0xFFFFFFFFUL; 219771fe6b9SJerome Glisse rdev->mc.gtt_location = 0xFFFFFFFFUL; 220771fe6b9SJerome Glisse if (rdev->flags & RADEON_IS_AGP) { 221771fe6b9SJerome Glisse r = radeon_agp_init(rdev); 222771fe6b9SJerome Glisse if (r) { 223771fe6b9SJerome Glisse printk(KERN_WARNING "[drm] Disabling AGP\n"); 224771fe6b9SJerome Glisse rdev->flags &= ~RADEON_IS_AGP; 225771fe6b9SJerome Glisse rdev->mc.gtt_size = radeon_gart_size * 1024 * 1024; 226771fe6b9SJerome Glisse } else { 227771fe6b9SJerome Glisse rdev->mc.gtt_location = rdev->mc.agp_base; 228771fe6b9SJerome Glisse } 229771fe6b9SJerome Glisse } 230771fe6b9SJerome Glisse r = radeon_mc_setup(rdev); 231771fe6b9SJerome Glisse if (r) { 232771fe6b9SJerome Glisse return r; 233771fe6b9SJerome Glisse } 234771fe6b9SJerome Glisse 235771fe6b9SJerome Glisse r100_mc_disable_clients(rdev); 236771fe6b9SJerome Glisse if (r100_mc_wait_for_idle(rdev)) { 237771fe6b9SJerome Glisse printk(KERN_WARNING "Failed to wait MC idle while " 238771fe6b9SJerome Glisse "programming pipes. Bad things might happen.\n"); 239771fe6b9SJerome Glisse } 240771fe6b9SJerome Glisse 241771fe6b9SJerome Glisse r100_mc_setup(rdev); 242771fe6b9SJerome Glisse return 0; 243771fe6b9SJerome Glisse } 244771fe6b9SJerome Glisse 245771fe6b9SJerome Glisse void r100_mc_fini(struct radeon_device *rdev) 246771fe6b9SJerome Glisse { 247771fe6b9SJerome Glisse r100_pci_gart_disable(rdev); 248771fe6b9SJerome Glisse radeon_gart_table_ram_free(rdev); 249771fe6b9SJerome Glisse radeon_gart_fini(rdev); 250771fe6b9SJerome Glisse } 251771fe6b9SJerome Glisse 252771fe6b9SJerome Glisse 253771fe6b9SJerome Glisse /* 254771fe6b9SJerome Glisse * Fence emission 255771fe6b9SJerome Glisse */ 256771fe6b9SJerome Glisse void r100_fence_ring_emit(struct radeon_device *rdev, 257771fe6b9SJerome Glisse struct radeon_fence *fence) 258771fe6b9SJerome Glisse { 259771fe6b9SJerome Glisse /* Who ever call radeon_fence_emit should call ring_lock and ask 260771fe6b9SJerome Glisse * for enough space (today caller are ib schedule and buffer move) */ 261771fe6b9SJerome Glisse /* Wait until IDLE & CLEAN */ 262771fe6b9SJerome Glisse radeon_ring_write(rdev, PACKET0(0x1720, 0)); 263771fe6b9SJerome Glisse radeon_ring_write(rdev, (1 << 16) | (1 << 17)); 264771fe6b9SJerome Glisse /* Emit fence sequence & fire IRQ */ 265771fe6b9SJerome Glisse radeon_ring_write(rdev, PACKET0(rdev->fence_drv.scratch_reg, 0)); 266771fe6b9SJerome Glisse radeon_ring_write(rdev, fence->seq); 267771fe6b9SJerome Glisse radeon_ring_write(rdev, PACKET0(RADEON_GEN_INT_STATUS, 0)); 268771fe6b9SJerome Glisse radeon_ring_write(rdev, RADEON_SW_INT_FIRE); 269771fe6b9SJerome Glisse } 270771fe6b9SJerome Glisse 271771fe6b9SJerome Glisse 272771fe6b9SJerome Glisse /* 273771fe6b9SJerome Glisse * Writeback 274771fe6b9SJerome Glisse */ 275771fe6b9SJerome Glisse int r100_wb_init(struct radeon_device *rdev) 276771fe6b9SJerome Glisse { 277771fe6b9SJerome Glisse int r; 278771fe6b9SJerome Glisse 279771fe6b9SJerome Glisse if (rdev->wb.wb_obj == NULL) { 280771fe6b9SJerome Glisse r = radeon_object_create(rdev, NULL, 4096, 281771fe6b9SJerome Glisse true, 282771fe6b9SJerome Glisse RADEON_GEM_DOMAIN_GTT, 283771fe6b9SJerome Glisse false, &rdev->wb.wb_obj); 284771fe6b9SJerome Glisse if (r) { 285771fe6b9SJerome Glisse DRM_ERROR("radeon: failed to create WB buffer (%d).\n", r); 286771fe6b9SJerome Glisse return r; 287771fe6b9SJerome Glisse } 288771fe6b9SJerome Glisse r = radeon_object_pin(rdev->wb.wb_obj, 289771fe6b9SJerome Glisse RADEON_GEM_DOMAIN_GTT, 290771fe6b9SJerome Glisse &rdev->wb.gpu_addr); 291771fe6b9SJerome Glisse if (r) { 292771fe6b9SJerome Glisse DRM_ERROR("radeon: failed to pin WB buffer (%d).\n", r); 293771fe6b9SJerome Glisse return r; 294771fe6b9SJerome Glisse } 295771fe6b9SJerome Glisse r = radeon_object_kmap(rdev->wb.wb_obj, (void **)&rdev->wb.wb); 296771fe6b9SJerome Glisse if (r) { 297771fe6b9SJerome Glisse DRM_ERROR("radeon: failed to map WB buffer (%d).\n", r); 298771fe6b9SJerome Glisse return r; 299771fe6b9SJerome Glisse } 300771fe6b9SJerome Glisse } 301771fe6b9SJerome Glisse WREG32(0x774, rdev->wb.gpu_addr); 302771fe6b9SJerome Glisse WREG32(0x70C, rdev->wb.gpu_addr + 1024); 303771fe6b9SJerome Glisse WREG32(0x770, 0xff); 304771fe6b9SJerome Glisse return 0; 305771fe6b9SJerome Glisse } 306771fe6b9SJerome Glisse 307771fe6b9SJerome Glisse void r100_wb_fini(struct radeon_device *rdev) 308771fe6b9SJerome Glisse { 309771fe6b9SJerome Glisse if (rdev->wb.wb_obj) { 310771fe6b9SJerome Glisse radeon_object_kunmap(rdev->wb.wb_obj); 311771fe6b9SJerome Glisse radeon_object_unpin(rdev->wb.wb_obj); 312771fe6b9SJerome Glisse radeon_object_unref(&rdev->wb.wb_obj); 313771fe6b9SJerome Glisse rdev->wb.wb = NULL; 314771fe6b9SJerome Glisse rdev->wb.wb_obj = NULL; 315771fe6b9SJerome Glisse } 316771fe6b9SJerome Glisse } 317771fe6b9SJerome Glisse 318771fe6b9SJerome Glisse int r100_copy_blit(struct radeon_device *rdev, 319771fe6b9SJerome Glisse uint64_t src_offset, 320771fe6b9SJerome Glisse uint64_t dst_offset, 321771fe6b9SJerome Glisse unsigned num_pages, 322771fe6b9SJerome Glisse struct radeon_fence *fence) 323771fe6b9SJerome Glisse { 324771fe6b9SJerome Glisse uint32_t cur_pages; 325771fe6b9SJerome Glisse uint32_t stride_bytes = PAGE_SIZE; 326771fe6b9SJerome Glisse uint32_t pitch; 327771fe6b9SJerome Glisse uint32_t stride_pixels; 328771fe6b9SJerome Glisse unsigned ndw; 329771fe6b9SJerome Glisse int num_loops; 330771fe6b9SJerome Glisse int r = 0; 331771fe6b9SJerome Glisse 332771fe6b9SJerome Glisse /* radeon limited to 16k stride */ 333771fe6b9SJerome Glisse stride_bytes &= 0x3fff; 334771fe6b9SJerome Glisse /* radeon pitch is /64 */ 335771fe6b9SJerome Glisse pitch = stride_bytes / 64; 336771fe6b9SJerome Glisse stride_pixels = stride_bytes / 4; 337771fe6b9SJerome Glisse num_loops = DIV_ROUND_UP(num_pages, 8191); 338771fe6b9SJerome Glisse 339771fe6b9SJerome Glisse /* Ask for enough room for blit + flush + fence */ 340771fe6b9SJerome Glisse ndw = 64 + (10 * num_loops); 341771fe6b9SJerome Glisse r = radeon_ring_lock(rdev, ndw); 342771fe6b9SJerome Glisse if (r) { 343771fe6b9SJerome Glisse DRM_ERROR("radeon: moving bo (%d) asking for %u dw.\n", r, ndw); 344771fe6b9SJerome Glisse return -EINVAL; 345771fe6b9SJerome Glisse } 346771fe6b9SJerome Glisse while (num_pages > 0) { 347771fe6b9SJerome Glisse cur_pages = num_pages; 348771fe6b9SJerome Glisse if (cur_pages > 8191) { 349771fe6b9SJerome Glisse cur_pages = 8191; 350771fe6b9SJerome Glisse } 351771fe6b9SJerome Glisse num_pages -= cur_pages; 352771fe6b9SJerome Glisse 353771fe6b9SJerome Glisse /* pages are in Y direction - height 354771fe6b9SJerome Glisse page width in X direction - width */ 355771fe6b9SJerome Glisse radeon_ring_write(rdev, PACKET3(PACKET3_BITBLT_MULTI, 8)); 356771fe6b9SJerome Glisse radeon_ring_write(rdev, 357771fe6b9SJerome Glisse RADEON_GMC_SRC_PITCH_OFFSET_CNTL | 358771fe6b9SJerome Glisse RADEON_GMC_DST_PITCH_OFFSET_CNTL | 359771fe6b9SJerome Glisse RADEON_GMC_SRC_CLIPPING | 360771fe6b9SJerome Glisse RADEON_GMC_DST_CLIPPING | 361771fe6b9SJerome Glisse RADEON_GMC_BRUSH_NONE | 362771fe6b9SJerome Glisse (RADEON_COLOR_FORMAT_ARGB8888 << 8) | 363771fe6b9SJerome Glisse RADEON_GMC_SRC_DATATYPE_COLOR | 364771fe6b9SJerome Glisse RADEON_ROP3_S | 365771fe6b9SJerome Glisse RADEON_DP_SRC_SOURCE_MEMORY | 366771fe6b9SJerome Glisse RADEON_GMC_CLR_CMP_CNTL_DIS | 367771fe6b9SJerome Glisse RADEON_GMC_WR_MSK_DIS); 368771fe6b9SJerome Glisse radeon_ring_write(rdev, (pitch << 22) | (src_offset >> 10)); 369771fe6b9SJerome Glisse radeon_ring_write(rdev, (pitch << 22) | (dst_offset >> 10)); 370771fe6b9SJerome Glisse radeon_ring_write(rdev, (0x1fff) | (0x1fff << 16)); 371771fe6b9SJerome Glisse radeon_ring_write(rdev, 0); 372771fe6b9SJerome Glisse radeon_ring_write(rdev, (0x1fff) | (0x1fff << 16)); 373771fe6b9SJerome Glisse radeon_ring_write(rdev, num_pages); 374771fe6b9SJerome Glisse radeon_ring_write(rdev, num_pages); 375771fe6b9SJerome Glisse radeon_ring_write(rdev, cur_pages | (stride_pixels << 16)); 376771fe6b9SJerome Glisse } 377771fe6b9SJerome Glisse radeon_ring_write(rdev, PACKET0(RADEON_DSTCACHE_CTLSTAT, 0)); 378771fe6b9SJerome Glisse radeon_ring_write(rdev, RADEON_RB2D_DC_FLUSH_ALL); 379771fe6b9SJerome Glisse radeon_ring_write(rdev, PACKET0(RADEON_WAIT_UNTIL, 0)); 380771fe6b9SJerome Glisse radeon_ring_write(rdev, 381771fe6b9SJerome Glisse RADEON_WAIT_2D_IDLECLEAN | 382771fe6b9SJerome Glisse RADEON_WAIT_HOST_IDLECLEAN | 383771fe6b9SJerome Glisse RADEON_WAIT_DMA_GUI_IDLE); 384771fe6b9SJerome Glisse if (fence) { 385771fe6b9SJerome Glisse r = radeon_fence_emit(rdev, fence); 386771fe6b9SJerome Glisse } 387771fe6b9SJerome Glisse radeon_ring_unlock_commit(rdev); 388771fe6b9SJerome Glisse return r; 389771fe6b9SJerome Glisse } 390771fe6b9SJerome Glisse 391771fe6b9SJerome Glisse 392771fe6b9SJerome Glisse /* 393771fe6b9SJerome Glisse * CP 394771fe6b9SJerome Glisse */ 395771fe6b9SJerome Glisse void r100_ring_start(struct radeon_device *rdev) 396771fe6b9SJerome Glisse { 397771fe6b9SJerome Glisse int r; 398771fe6b9SJerome Glisse 399771fe6b9SJerome Glisse r = radeon_ring_lock(rdev, 2); 400771fe6b9SJerome Glisse if (r) { 401771fe6b9SJerome Glisse return; 402771fe6b9SJerome Glisse } 403771fe6b9SJerome Glisse radeon_ring_write(rdev, PACKET0(RADEON_ISYNC_CNTL, 0)); 404771fe6b9SJerome Glisse radeon_ring_write(rdev, 405771fe6b9SJerome Glisse RADEON_ISYNC_ANY2D_IDLE3D | 406771fe6b9SJerome Glisse RADEON_ISYNC_ANY3D_IDLE2D | 407771fe6b9SJerome Glisse RADEON_ISYNC_WAIT_IDLEGUI | 408771fe6b9SJerome Glisse RADEON_ISYNC_CPSCRATCH_IDLEGUI); 409771fe6b9SJerome Glisse radeon_ring_unlock_commit(rdev); 410771fe6b9SJerome Glisse } 411771fe6b9SJerome Glisse 412771fe6b9SJerome Glisse static void r100_cp_load_microcode(struct radeon_device *rdev) 413771fe6b9SJerome Glisse { 414771fe6b9SJerome Glisse int i; 415771fe6b9SJerome Glisse 416771fe6b9SJerome Glisse if (r100_gui_wait_for_idle(rdev)) { 417771fe6b9SJerome Glisse printk(KERN_WARNING "Failed to wait GUI idle while " 418771fe6b9SJerome Glisse "programming pipes. Bad things might happen.\n"); 419771fe6b9SJerome Glisse } 420771fe6b9SJerome Glisse 421771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_ADDR, 0); 422771fe6b9SJerome Glisse if ((rdev->family == CHIP_R100) || (rdev->family == CHIP_RV100) || 423771fe6b9SJerome Glisse (rdev->family == CHIP_RV200) || (rdev->family == CHIP_RS100) || 424771fe6b9SJerome Glisse (rdev->family == CHIP_RS200)) { 425771fe6b9SJerome Glisse DRM_INFO("Loading R100 Microcode\n"); 426771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 427771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAH, R100_cp_microcode[i][1]); 428771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAL, R100_cp_microcode[i][0]); 429771fe6b9SJerome Glisse } 430771fe6b9SJerome Glisse } else if ((rdev->family == CHIP_R200) || 431771fe6b9SJerome Glisse (rdev->family == CHIP_RV250) || 432771fe6b9SJerome Glisse (rdev->family == CHIP_RV280) || 433771fe6b9SJerome Glisse (rdev->family == CHIP_RS300)) { 434771fe6b9SJerome Glisse DRM_INFO("Loading R200 Microcode\n"); 435771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 436771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAH, R200_cp_microcode[i][1]); 437771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAL, R200_cp_microcode[i][0]); 438771fe6b9SJerome Glisse } 439771fe6b9SJerome Glisse } else if ((rdev->family == CHIP_R300) || 440771fe6b9SJerome Glisse (rdev->family == CHIP_R350) || 441771fe6b9SJerome Glisse (rdev->family == CHIP_RV350) || 442771fe6b9SJerome Glisse (rdev->family == CHIP_RV380) || 443771fe6b9SJerome Glisse (rdev->family == CHIP_RS400) || 444771fe6b9SJerome Glisse (rdev->family == CHIP_RS480)) { 445771fe6b9SJerome Glisse DRM_INFO("Loading R300 Microcode\n"); 446771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 447771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAH, R300_cp_microcode[i][1]); 448771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAL, R300_cp_microcode[i][0]); 449771fe6b9SJerome Glisse } 450771fe6b9SJerome Glisse } else if ((rdev->family == CHIP_R420) || 451771fe6b9SJerome Glisse (rdev->family == CHIP_R423) || 452771fe6b9SJerome Glisse (rdev->family == CHIP_RV410)) { 453771fe6b9SJerome Glisse DRM_INFO("Loading R400 Microcode\n"); 454771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 455771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAH, R420_cp_microcode[i][1]); 456771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAL, R420_cp_microcode[i][0]); 457771fe6b9SJerome Glisse } 458771fe6b9SJerome Glisse } else if ((rdev->family == CHIP_RS690) || 459771fe6b9SJerome Glisse (rdev->family == CHIP_RS740)) { 460771fe6b9SJerome Glisse DRM_INFO("Loading RS690/RS740 Microcode\n"); 461771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 462771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAH, RS690_cp_microcode[i][1]); 463771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAL, RS690_cp_microcode[i][0]); 464771fe6b9SJerome Glisse } 465771fe6b9SJerome Glisse } else if (rdev->family == CHIP_RS600) { 466771fe6b9SJerome Glisse DRM_INFO("Loading RS600 Microcode\n"); 467771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 468771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAH, RS600_cp_microcode[i][1]); 469771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAL, RS600_cp_microcode[i][0]); 470771fe6b9SJerome Glisse } 471771fe6b9SJerome Glisse } else if ((rdev->family == CHIP_RV515) || 472771fe6b9SJerome Glisse (rdev->family == CHIP_R520) || 473771fe6b9SJerome Glisse (rdev->family == CHIP_RV530) || 474771fe6b9SJerome Glisse (rdev->family == CHIP_R580) || 475771fe6b9SJerome Glisse (rdev->family == CHIP_RV560) || 476771fe6b9SJerome Glisse (rdev->family == CHIP_RV570)) { 477771fe6b9SJerome Glisse DRM_INFO("Loading R500 Microcode\n"); 478771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 479771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAH, R520_cp_microcode[i][1]); 480771fe6b9SJerome Glisse WREG32(RADEON_CP_ME_RAM_DATAL, R520_cp_microcode[i][0]); 481771fe6b9SJerome Glisse } 482771fe6b9SJerome Glisse } 483771fe6b9SJerome Glisse } 484771fe6b9SJerome Glisse 485771fe6b9SJerome Glisse int r100_cp_init(struct radeon_device *rdev, unsigned ring_size) 486771fe6b9SJerome Glisse { 487771fe6b9SJerome Glisse unsigned rb_bufsz; 488771fe6b9SJerome Glisse unsigned rb_blksz; 489771fe6b9SJerome Glisse unsigned max_fetch; 490771fe6b9SJerome Glisse unsigned pre_write_timer; 491771fe6b9SJerome Glisse unsigned pre_write_limit; 492771fe6b9SJerome Glisse unsigned indirect2_start; 493771fe6b9SJerome Glisse unsigned indirect1_start; 494771fe6b9SJerome Glisse uint32_t tmp; 495771fe6b9SJerome Glisse int r; 496771fe6b9SJerome Glisse 497771fe6b9SJerome Glisse if (r100_debugfs_cp_init(rdev)) { 498771fe6b9SJerome Glisse DRM_ERROR("Failed to register debugfs file for CP !\n"); 499771fe6b9SJerome Glisse } 500771fe6b9SJerome Glisse /* Reset CP */ 501771fe6b9SJerome Glisse tmp = RREG32(RADEON_CP_CSQ_STAT); 502771fe6b9SJerome Glisse if ((tmp & (1 << 31))) { 503771fe6b9SJerome Glisse DRM_INFO("radeon: cp busy (0x%08X) resetting\n", tmp); 504771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_MODE, 0); 505771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_CNTL, 0); 506771fe6b9SJerome Glisse WREG32(RADEON_RBBM_SOFT_RESET, RADEON_SOFT_RESET_CP); 507771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_SOFT_RESET); 508771fe6b9SJerome Glisse mdelay(2); 509771fe6b9SJerome Glisse WREG32(RADEON_RBBM_SOFT_RESET, 0); 510771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_SOFT_RESET); 511771fe6b9SJerome Glisse mdelay(2); 512771fe6b9SJerome Glisse tmp = RREG32(RADEON_CP_CSQ_STAT); 513771fe6b9SJerome Glisse if ((tmp & (1 << 31))) { 514771fe6b9SJerome Glisse DRM_INFO("radeon: cp reset failed (0x%08X)\n", tmp); 515771fe6b9SJerome Glisse } 516771fe6b9SJerome Glisse } else { 517771fe6b9SJerome Glisse DRM_INFO("radeon: cp idle (0x%08X)\n", tmp); 518771fe6b9SJerome Glisse } 519771fe6b9SJerome Glisse /* Align ring size */ 520771fe6b9SJerome Glisse rb_bufsz = drm_order(ring_size / 8); 521771fe6b9SJerome Glisse ring_size = (1 << (rb_bufsz + 1)) * 4; 522771fe6b9SJerome Glisse r100_cp_load_microcode(rdev); 523771fe6b9SJerome Glisse r = radeon_ring_init(rdev, ring_size); 524771fe6b9SJerome Glisse if (r) { 525771fe6b9SJerome Glisse return r; 526771fe6b9SJerome Glisse } 527771fe6b9SJerome Glisse /* Each time the cp read 1024 bytes (16 dword/quadword) update 528771fe6b9SJerome Glisse * the rptr copy in system ram */ 529771fe6b9SJerome Glisse rb_blksz = 9; 530771fe6b9SJerome Glisse /* cp will read 128bytes at a time (4 dwords) */ 531771fe6b9SJerome Glisse max_fetch = 1; 532771fe6b9SJerome Glisse rdev->cp.align_mask = 16 - 1; 533771fe6b9SJerome Glisse /* Write to CP_RB_WPTR will be delayed for pre_write_timer clocks */ 534771fe6b9SJerome Glisse pre_write_timer = 64; 535771fe6b9SJerome Glisse /* Force CP_RB_WPTR write if written more than one time before the 536771fe6b9SJerome Glisse * delay expire 537771fe6b9SJerome Glisse */ 538771fe6b9SJerome Glisse pre_write_limit = 0; 539771fe6b9SJerome Glisse /* Setup the cp cache like this (cache size is 96 dwords) : 540771fe6b9SJerome Glisse * RING 0 to 15 541771fe6b9SJerome Glisse * INDIRECT1 16 to 79 542771fe6b9SJerome Glisse * INDIRECT2 80 to 95 543771fe6b9SJerome Glisse * So ring cache size is 16dwords (> (2 * max_fetch = 2 * 4dwords)) 544771fe6b9SJerome Glisse * indirect1 cache size is 64dwords (> (2 * max_fetch = 2 * 4dwords)) 545771fe6b9SJerome Glisse * indirect2 cache size is 16dwords (> (2 * max_fetch = 2 * 4dwords)) 546771fe6b9SJerome Glisse * Idea being that most of the gpu cmd will be through indirect1 buffer 547771fe6b9SJerome Glisse * so it gets the bigger cache. 548771fe6b9SJerome Glisse */ 549771fe6b9SJerome Glisse indirect2_start = 80; 550771fe6b9SJerome Glisse indirect1_start = 16; 551771fe6b9SJerome Glisse /* cp setup */ 552771fe6b9SJerome Glisse WREG32(0x718, pre_write_timer | (pre_write_limit << 28)); 553771fe6b9SJerome Glisse WREG32(RADEON_CP_RB_CNTL, 5544e484e7dSMichel Dänzer #ifdef __BIG_ENDIAN 5554e484e7dSMichel Dänzer RADEON_BUF_SWAP_32BIT | 5564e484e7dSMichel Dänzer #endif 557771fe6b9SJerome Glisse REG_SET(RADEON_RB_BUFSZ, rb_bufsz) | 558771fe6b9SJerome Glisse REG_SET(RADEON_RB_BLKSZ, rb_blksz) | 559771fe6b9SJerome Glisse REG_SET(RADEON_MAX_FETCH, max_fetch) | 560771fe6b9SJerome Glisse RADEON_RB_NO_UPDATE); 561771fe6b9SJerome Glisse /* Set ring address */ 562771fe6b9SJerome Glisse DRM_INFO("radeon: ring at 0x%016lX\n", (unsigned long)rdev->cp.gpu_addr); 563771fe6b9SJerome Glisse WREG32(RADEON_CP_RB_BASE, rdev->cp.gpu_addr); 564771fe6b9SJerome Glisse /* Force read & write ptr to 0 */ 565771fe6b9SJerome Glisse tmp = RREG32(RADEON_CP_RB_CNTL); 566771fe6b9SJerome Glisse WREG32(RADEON_CP_RB_CNTL, tmp | RADEON_RB_RPTR_WR_ENA); 567771fe6b9SJerome Glisse WREG32(RADEON_CP_RB_RPTR_WR, 0); 568771fe6b9SJerome Glisse WREG32(RADEON_CP_RB_WPTR, 0); 569771fe6b9SJerome Glisse WREG32(RADEON_CP_RB_CNTL, tmp); 570771fe6b9SJerome Glisse udelay(10); 571771fe6b9SJerome Glisse rdev->cp.rptr = RREG32(RADEON_CP_RB_RPTR); 572771fe6b9SJerome Glisse rdev->cp.wptr = RREG32(RADEON_CP_RB_WPTR); 573771fe6b9SJerome Glisse /* Set cp mode to bus mastering & enable cp*/ 574771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_MODE, 575771fe6b9SJerome Glisse REG_SET(RADEON_INDIRECT2_START, indirect2_start) | 576771fe6b9SJerome Glisse REG_SET(RADEON_INDIRECT1_START, indirect1_start)); 577771fe6b9SJerome Glisse WREG32(0x718, 0); 578771fe6b9SJerome Glisse WREG32(0x744, 0x00004D4D); 579771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_CNTL, RADEON_CSQ_PRIBM_INDBM); 580771fe6b9SJerome Glisse radeon_ring_start(rdev); 581771fe6b9SJerome Glisse r = radeon_ring_test(rdev); 582771fe6b9SJerome Glisse if (r) { 583771fe6b9SJerome Glisse DRM_ERROR("radeon: cp isn't working (%d).\n", r); 584771fe6b9SJerome Glisse return r; 585771fe6b9SJerome Glisse } 586771fe6b9SJerome Glisse rdev->cp.ready = true; 587771fe6b9SJerome Glisse return 0; 588771fe6b9SJerome Glisse } 589771fe6b9SJerome Glisse 590771fe6b9SJerome Glisse void r100_cp_fini(struct radeon_device *rdev) 591771fe6b9SJerome Glisse { 592771fe6b9SJerome Glisse /* Disable ring */ 593771fe6b9SJerome Glisse rdev->cp.ready = false; 594771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_CNTL, 0); 595771fe6b9SJerome Glisse radeon_ring_fini(rdev); 596771fe6b9SJerome Glisse DRM_INFO("radeon: cp finalized\n"); 597771fe6b9SJerome Glisse } 598771fe6b9SJerome Glisse 599771fe6b9SJerome Glisse void r100_cp_disable(struct radeon_device *rdev) 600771fe6b9SJerome Glisse { 601771fe6b9SJerome Glisse /* Disable ring */ 602771fe6b9SJerome Glisse rdev->cp.ready = false; 603771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_MODE, 0); 604771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_CNTL, 0); 605771fe6b9SJerome Glisse if (r100_gui_wait_for_idle(rdev)) { 606771fe6b9SJerome Glisse printk(KERN_WARNING "Failed to wait GUI idle while " 607771fe6b9SJerome Glisse "programming pipes. Bad things might happen.\n"); 608771fe6b9SJerome Glisse } 609771fe6b9SJerome Glisse } 610771fe6b9SJerome Glisse 611771fe6b9SJerome Glisse int r100_cp_reset(struct radeon_device *rdev) 612771fe6b9SJerome Glisse { 613771fe6b9SJerome Glisse uint32_t tmp; 614771fe6b9SJerome Glisse bool reinit_cp; 615771fe6b9SJerome Glisse int i; 616771fe6b9SJerome Glisse 617771fe6b9SJerome Glisse reinit_cp = rdev->cp.ready; 618771fe6b9SJerome Glisse rdev->cp.ready = false; 619771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_MODE, 0); 620771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_CNTL, 0); 621771fe6b9SJerome Glisse WREG32(RADEON_RBBM_SOFT_RESET, RADEON_SOFT_RESET_CP); 622771fe6b9SJerome Glisse (void)RREG32(RADEON_RBBM_SOFT_RESET); 623771fe6b9SJerome Glisse udelay(200); 624771fe6b9SJerome Glisse WREG32(RADEON_RBBM_SOFT_RESET, 0); 625771fe6b9SJerome Glisse /* Wait to prevent race in RBBM_STATUS */ 626771fe6b9SJerome Glisse mdelay(1); 627771fe6b9SJerome Glisse for (i = 0; i < rdev->usec_timeout; i++) { 628771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_STATUS); 629771fe6b9SJerome Glisse if (!(tmp & (1 << 16))) { 630771fe6b9SJerome Glisse DRM_INFO("CP reset succeed (RBBM_STATUS=0x%08X)\n", 631771fe6b9SJerome Glisse tmp); 632771fe6b9SJerome Glisse if (reinit_cp) { 633771fe6b9SJerome Glisse return r100_cp_init(rdev, rdev->cp.ring_size); 634771fe6b9SJerome Glisse } 635771fe6b9SJerome Glisse return 0; 636771fe6b9SJerome Glisse } 637771fe6b9SJerome Glisse DRM_UDELAY(1); 638771fe6b9SJerome Glisse } 639771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_STATUS); 640771fe6b9SJerome Glisse DRM_ERROR("Failed to reset CP (RBBM_STATUS=0x%08X)!\n", tmp); 641771fe6b9SJerome Glisse return -1; 642771fe6b9SJerome Glisse } 643771fe6b9SJerome Glisse 644771fe6b9SJerome Glisse 645771fe6b9SJerome Glisse /* 646771fe6b9SJerome Glisse * CS functions 647771fe6b9SJerome Glisse */ 648771fe6b9SJerome Glisse int r100_cs_parse_packet0(struct radeon_cs_parser *p, 649771fe6b9SJerome Glisse struct radeon_cs_packet *pkt, 650068a117cSJerome Glisse const unsigned *auth, unsigned n, 651771fe6b9SJerome Glisse radeon_packet0_check_t check) 652771fe6b9SJerome Glisse { 653771fe6b9SJerome Glisse unsigned reg; 654771fe6b9SJerome Glisse unsigned i, j, m; 655771fe6b9SJerome Glisse unsigned idx; 656771fe6b9SJerome Glisse int r; 657771fe6b9SJerome Glisse 658771fe6b9SJerome Glisse idx = pkt->idx + 1; 659771fe6b9SJerome Glisse reg = pkt->reg; 660068a117cSJerome Glisse /* Check that register fall into register range 661068a117cSJerome Glisse * determined by the number of entry (n) in the 662068a117cSJerome Glisse * safe register bitmap. 663068a117cSJerome Glisse */ 664771fe6b9SJerome Glisse if (pkt->one_reg_wr) { 665771fe6b9SJerome Glisse if ((reg >> 7) > n) { 666771fe6b9SJerome Glisse return -EINVAL; 667771fe6b9SJerome Glisse } 668771fe6b9SJerome Glisse } else { 669771fe6b9SJerome Glisse if (((reg + (pkt->count << 2)) >> 7) > n) { 670771fe6b9SJerome Glisse return -EINVAL; 671771fe6b9SJerome Glisse } 672771fe6b9SJerome Glisse } 673771fe6b9SJerome Glisse for (i = 0; i <= pkt->count; i++, idx++) { 674771fe6b9SJerome Glisse j = (reg >> 7); 675771fe6b9SJerome Glisse m = 1 << ((reg >> 2) & 31); 676771fe6b9SJerome Glisse if (auth[j] & m) { 677771fe6b9SJerome Glisse r = check(p, pkt, idx, reg); 678771fe6b9SJerome Glisse if (r) { 679771fe6b9SJerome Glisse return r; 680771fe6b9SJerome Glisse } 681771fe6b9SJerome Glisse } 682771fe6b9SJerome Glisse if (pkt->one_reg_wr) { 683771fe6b9SJerome Glisse if (!(auth[j] & m)) { 684771fe6b9SJerome Glisse break; 685771fe6b9SJerome Glisse } 686771fe6b9SJerome Glisse } else { 687771fe6b9SJerome Glisse reg += 4; 688771fe6b9SJerome Glisse } 689771fe6b9SJerome Glisse } 690771fe6b9SJerome Glisse return 0; 691771fe6b9SJerome Glisse } 692771fe6b9SJerome Glisse 693771fe6b9SJerome Glisse void r100_cs_dump_packet(struct radeon_cs_parser *p, 694771fe6b9SJerome Glisse struct radeon_cs_packet *pkt) 695771fe6b9SJerome Glisse { 696771fe6b9SJerome Glisse struct radeon_cs_chunk *ib_chunk; 697771fe6b9SJerome Glisse volatile uint32_t *ib; 698771fe6b9SJerome Glisse unsigned i; 699771fe6b9SJerome Glisse unsigned idx; 700771fe6b9SJerome Glisse 701771fe6b9SJerome Glisse ib = p->ib->ptr; 702771fe6b9SJerome Glisse ib_chunk = &p->chunks[p->chunk_ib_idx]; 703771fe6b9SJerome Glisse idx = pkt->idx; 704771fe6b9SJerome Glisse for (i = 0; i <= (pkt->count + 1); i++, idx++) { 705771fe6b9SJerome Glisse DRM_INFO("ib[%d]=0x%08X\n", idx, ib[idx]); 706771fe6b9SJerome Glisse } 707771fe6b9SJerome Glisse } 708771fe6b9SJerome Glisse 709771fe6b9SJerome Glisse /** 710771fe6b9SJerome Glisse * r100_cs_packet_parse() - parse cp packet and point ib index to next packet 711771fe6b9SJerome Glisse * @parser: parser structure holding parsing context. 712771fe6b9SJerome Glisse * @pkt: where to store packet informations 713771fe6b9SJerome Glisse * 714771fe6b9SJerome Glisse * Assume that chunk_ib_index is properly set. Will return -EINVAL 715771fe6b9SJerome Glisse * if packet is bigger than remaining ib size. or if packets is unknown. 716771fe6b9SJerome Glisse **/ 717771fe6b9SJerome Glisse int r100_cs_packet_parse(struct radeon_cs_parser *p, 718771fe6b9SJerome Glisse struct radeon_cs_packet *pkt, 719771fe6b9SJerome Glisse unsigned idx) 720771fe6b9SJerome Glisse { 721771fe6b9SJerome Glisse struct radeon_cs_chunk *ib_chunk = &p->chunks[p->chunk_ib_idx]; 722771fe6b9SJerome Glisse uint32_t header = ib_chunk->kdata[idx]; 723771fe6b9SJerome Glisse 724771fe6b9SJerome Glisse if (idx >= ib_chunk->length_dw) { 725771fe6b9SJerome Glisse DRM_ERROR("Can not parse packet at %d after CS end %d !\n", 726771fe6b9SJerome Glisse idx, ib_chunk->length_dw); 727771fe6b9SJerome Glisse return -EINVAL; 728771fe6b9SJerome Glisse } 729771fe6b9SJerome Glisse pkt->idx = idx; 730771fe6b9SJerome Glisse pkt->type = CP_PACKET_GET_TYPE(header); 731771fe6b9SJerome Glisse pkt->count = CP_PACKET_GET_COUNT(header); 732771fe6b9SJerome Glisse switch (pkt->type) { 733771fe6b9SJerome Glisse case PACKET_TYPE0: 734771fe6b9SJerome Glisse pkt->reg = CP_PACKET0_GET_REG(header); 735771fe6b9SJerome Glisse pkt->one_reg_wr = CP_PACKET0_GET_ONE_REG_WR(header); 736771fe6b9SJerome Glisse break; 737771fe6b9SJerome Glisse case PACKET_TYPE3: 738771fe6b9SJerome Glisse pkt->opcode = CP_PACKET3_GET_OPCODE(header); 739771fe6b9SJerome Glisse break; 740771fe6b9SJerome Glisse case PACKET_TYPE2: 741771fe6b9SJerome Glisse pkt->count = -1; 742771fe6b9SJerome Glisse break; 743771fe6b9SJerome Glisse default: 744771fe6b9SJerome Glisse DRM_ERROR("Unknown packet type %d at %d !\n", pkt->type, idx); 745771fe6b9SJerome Glisse return -EINVAL; 746771fe6b9SJerome Glisse } 747771fe6b9SJerome Glisse if ((pkt->count + 1 + pkt->idx) >= ib_chunk->length_dw) { 748771fe6b9SJerome Glisse DRM_ERROR("Packet (%d:%d:%d) end after CS buffer (%d) !\n", 749771fe6b9SJerome Glisse pkt->idx, pkt->type, pkt->count, ib_chunk->length_dw); 750771fe6b9SJerome Glisse return -EINVAL; 751771fe6b9SJerome Glisse } 752771fe6b9SJerome Glisse return 0; 753771fe6b9SJerome Glisse } 754771fe6b9SJerome Glisse 755771fe6b9SJerome Glisse /** 756771fe6b9SJerome Glisse * r100_cs_packet_next_reloc() - parse next packet which should be reloc packet3 757771fe6b9SJerome Glisse * @parser: parser structure holding parsing context. 758771fe6b9SJerome Glisse * @data: pointer to relocation data 759771fe6b9SJerome Glisse * @offset_start: starting offset 760771fe6b9SJerome Glisse * @offset_mask: offset mask (to align start offset on) 761771fe6b9SJerome Glisse * @reloc: reloc informations 762771fe6b9SJerome Glisse * 763771fe6b9SJerome Glisse * Check next packet is relocation packet3, do bo validation and compute 764771fe6b9SJerome Glisse * GPU offset using the provided start. 765771fe6b9SJerome Glisse **/ 766771fe6b9SJerome Glisse int r100_cs_packet_next_reloc(struct radeon_cs_parser *p, 767771fe6b9SJerome Glisse struct radeon_cs_reloc **cs_reloc) 768771fe6b9SJerome Glisse { 769771fe6b9SJerome Glisse struct radeon_cs_chunk *ib_chunk; 770771fe6b9SJerome Glisse struct radeon_cs_chunk *relocs_chunk; 771771fe6b9SJerome Glisse struct radeon_cs_packet p3reloc; 772771fe6b9SJerome Glisse unsigned idx; 773771fe6b9SJerome Glisse int r; 774771fe6b9SJerome Glisse 775771fe6b9SJerome Glisse if (p->chunk_relocs_idx == -1) { 776771fe6b9SJerome Glisse DRM_ERROR("No relocation chunk !\n"); 777771fe6b9SJerome Glisse return -EINVAL; 778771fe6b9SJerome Glisse } 779771fe6b9SJerome Glisse *cs_reloc = NULL; 780771fe6b9SJerome Glisse ib_chunk = &p->chunks[p->chunk_ib_idx]; 781771fe6b9SJerome Glisse relocs_chunk = &p->chunks[p->chunk_relocs_idx]; 782771fe6b9SJerome Glisse r = r100_cs_packet_parse(p, &p3reloc, p->idx); 783771fe6b9SJerome Glisse if (r) { 784771fe6b9SJerome Glisse return r; 785771fe6b9SJerome Glisse } 786771fe6b9SJerome Glisse p->idx += p3reloc.count + 2; 787771fe6b9SJerome Glisse if (p3reloc.type != PACKET_TYPE3 || p3reloc.opcode != PACKET3_NOP) { 788771fe6b9SJerome Glisse DRM_ERROR("No packet3 for relocation for packet at %d.\n", 789771fe6b9SJerome Glisse p3reloc.idx); 790771fe6b9SJerome Glisse r100_cs_dump_packet(p, &p3reloc); 791771fe6b9SJerome Glisse return -EINVAL; 792771fe6b9SJerome Glisse } 793771fe6b9SJerome Glisse idx = ib_chunk->kdata[p3reloc.idx + 1]; 794771fe6b9SJerome Glisse if (idx >= relocs_chunk->length_dw) { 795771fe6b9SJerome Glisse DRM_ERROR("Relocs at %d after relocations chunk end %d !\n", 796771fe6b9SJerome Glisse idx, relocs_chunk->length_dw); 797771fe6b9SJerome Glisse r100_cs_dump_packet(p, &p3reloc); 798771fe6b9SJerome Glisse return -EINVAL; 799771fe6b9SJerome Glisse } 800771fe6b9SJerome Glisse /* FIXME: we assume reloc size is 4 dwords */ 801771fe6b9SJerome Glisse *cs_reloc = p->relocs_ptr[(idx / 4)]; 802771fe6b9SJerome Glisse return 0; 803771fe6b9SJerome Glisse } 804771fe6b9SJerome Glisse 805771fe6b9SJerome Glisse static int r100_packet0_check(struct radeon_cs_parser *p, 806771fe6b9SJerome Glisse struct radeon_cs_packet *pkt) 807771fe6b9SJerome Glisse { 808771fe6b9SJerome Glisse struct radeon_cs_chunk *ib_chunk; 809771fe6b9SJerome Glisse struct radeon_cs_reloc *reloc; 810771fe6b9SJerome Glisse volatile uint32_t *ib; 811771fe6b9SJerome Glisse uint32_t tmp; 812771fe6b9SJerome Glisse unsigned reg; 813771fe6b9SJerome Glisse unsigned i; 814771fe6b9SJerome Glisse unsigned idx; 815771fe6b9SJerome Glisse bool onereg; 816771fe6b9SJerome Glisse int r; 817771fe6b9SJerome Glisse 818771fe6b9SJerome Glisse ib = p->ib->ptr; 819771fe6b9SJerome Glisse ib_chunk = &p->chunks[p->chunk_ib_idx]; 820771fe6b9SJerome Glisse idx = pkt->idx + 1; 821771fe6b9SJerome Glisse reg = pkt->reg; 822771fe6b9SJerome Glisse onereg = false; 823771fe6b9SJerome Glisse if (CP_PACKET0_GET_ONE_REG_WR(ib_chunk->kdata[pkt->idx])) { 824771fe6b9SJerome Glisse onereg = true; 825771fe6b9SJerome Glisse } 826771fe6b9SJerome Glisse for (i = 0; i <= pkt->count; i++, idx++, reg += 4) { 827771fe6b9SJerome Glisse switch (reg) { 828771fe6b9SJerome Glisse /* FIXME: only allow PACKET3 blit? easier to check for out of 829771fe6b9SJerome Glisse * range access */ 830771fe6b9SJerome Glisse case RADEON_DST_PITCH_OFFSET: 831771fe6b9SJerome Glisse case RADEON_SRC_PITCH_OFFSET: 832771fe6b9SJerome Glisse r = r100_cs_packet_next_reloc(p, &reloc); 833771fe6b9SJerome Glisse if (r) { 834771fe6b9SJerome Glisse DRM_ERROR("No reloc for ib[%d]=0x%04X\n", 835771fe6b9SJerome Glisse idx, reg); 836771fe6b9SJerome Glisse r100_cs_dump_packet(p, pkt); 837771fe6b9SJerome Glisse return r; 838771fe6b9SJerome Glisse } 839771fe6b9SJerome Glisse tmp = ib_chunk->kdata[idx] & 0x003fffff; 840771fe6b9SJerome Glisse tmp += (((u32)reloc->lobj.gpu_offset) >> 10); 841771fe6b9SJerome Glisse ib[idx] = (ib_chunk->kdata[idx] & 0xffc00000) | tmp; 842771fe6b9SJerome Glisse break; 843771fe6b9SJerome Glisse case RADEON_RB3D_DEPTHOFFSET: 844771fe6b9SJerome Glisse case RADEON_RB3D_COLOROFFSET: 845771fe6b9SJerome Glisse case R300_RB3D_COLOROFFSET0: 846771fe6b9SJerome Glisse case R300_ZB_DEPTHOFFSET: 847771fe6b9SJerome Glisse case R200_PP_TXOFFSET_0: 848771fe6b9SJerome Glisse case R200_PP_TXOFFSET_1: 849771fe6b9SJerome Glisse case R200_PP_TXOFFSET_2: 850771fe6b9SJerome Glisse case R200_PP_TXOFFSET_3: 851771fe6b9SJerome Glisse case R200_PP_TXOFFSET_4: 852771fe6b9SJerome Glisse case R200_PP_TXOFFSET_5: 853771fe6b9SJerome Glisse case RADEON_PP_TXOFFSET_0: 854771fe6b9SJerome Glisse case RADEON_PP_TXOFFSET_1: 855771fe6b9SJerome Glisse case RADEON_PP_TXOFFSET_2: 856771fe6b9SJerome Glisse case R300_TX_OFFSET_0: 857771fe6b9SJerome Glisse case R300_TX_OFFSET_0+4: 858771fe6b9SJerome Glisse case R300_TX_OFFSET_0+8: 859771fe6b9SJerome Glisse case R300_TX_OFFSET_0+12: 860771fe6b9SJerome Glisse case R300_TX_OFFSET_0+16: 861771fe6b9SJerome Glisse case R300_TX_OFFSET_0+20: 862771fe6b9SJerome Glisse case R300_TX_OFFSET_0+24: 863771fe6b9SJerome Glisse case R300_TX_OFFSET_0+28: 864771fe6b9SJerome Glisse case R300_TX_OFFSET_0+32: 865771fe6b9SJerome Glisse case R300_TX_OFFSET_0+36: 866771fe6b9SJerome Glisse case R300_TX_OFFSET_0+40: 867771fe6b9SJerome Glisse case R300_TX_OFFSET_0+44: 868771fe6b9SJerome Glisse case R300_TX_OFFSET_0+48: 869771fe6b9SJerome Glisse case R300_TX_OFFSET_0+52: 870771fe6b9SJerome Glisse case R300_TX_OFFSET_0+56: 871771fe6b9SJerome Glisse case R300_TX_OFFSET_0+60: 872771fe6b9SJerome Glisse r = r100_cs_packet_next_reloc(p, &reloc); 873771fe6b9SJerome Glisse if (r) { 874771fe6b9SJerome Glisse DRM_ERROR("No reloc for ib[%d]=0x%04X\n", 875771fe6b9SJerome Glisse idx, reg); 876771fe6b9SJerome Glisse r100_cs_dump_packet(p, pkt); 877771fe6b9SJerome Glisse return r; 878771fe6b9SJerome Glisse } 879771fe6b9SJerome Glisse ib[idx] = ib_chunk->kdata[idx] + ((u32)reloc->lobj.gpu_offset); 880771fe6b9SJerome Glisse break; 881771fe6b9SJerome Glisse default: 882771fe6b9SJerome Glisse /* FIXME: we don't want to allow anyothers packet */ 883771fe6b9SJerome Glisse break; 884771fe6b9SJerome Glisse } 885771fe6b9SJerome Glisse if (onereg) { 886771fe6b9SJerome Glisse /* FIXME: forbid onereg write to register on relocate */ 887771fe6b9SJerome Glisse break; 888771fe6b9SJerome Glisse } 889771fe6b9SJerome Glisse } 890771fe6b9SJerome Glisse return 0; 891771fe6b9SJerome Glisse } 892771fe6b9SJerome Glisse 893068a117cSJerome Glisse int r100_cs_track_check_pkt3_indx_buffer(struct radeon_cs_parser *p, 894068a117cSJerome Glisse struct radeon_cs_packet *pkt, 895068a117cSJerome Glisse struct radeon_object *robj) 896068a117cSJerome Glisse { 897068a117cSJerome Glisse struct radeon_cs_chunk *ib_chunk; 898068a117cSJerome Glisse unsigned idx; 899068a117cSJerome Glisse 900068a117cSJerome Glisse ib_chunk = &p->chunks[p->chunk_ib_idx]; 901068a117cSJerome Glisse idx = pkt->idx + 1; 902068a117cSJerome Glisse if ((ib_chunk->kdata[idx+2] + 1) > radeon_object_size(robj)) { 903068a117cSJerome Glisse DRM_ERROR("[drm] Buffer too small for PACKET3 INDX_BUFFER " 904068a117cSJerome Glisse "(need %u have %lu) !\n", 905068a117cSJerome Glisse ib_chunk->kdata[idx+2] + 1, 906068a117cSJerome Glisse radeon_object_size(robj)); 907068a117cSJerome Glisse return -EINVAL; 908068a117cSJerome Glisse } 909068a117cSJerome Glisse return 0; 910068a117cSJerome Glisse } 911068a117cSJerome Glisse 912771fe6b9SJerome Glisse static int r100_packet3_check(struct radeon_cs_parser *p, 913771fe6b9SJerome Glisse struct radeon_cs_packet *pkt) 914771fe6b9SJerome Glisse { 915771fe6b9SJerome Glisse struct radeon_cs_chunk *ib_chunk; 916771fe6b9SJerome Glisse struct radeon_cs_reloc *reloc; 917771fe6b9SJerome Glisse unsigned idx; 918771fe6b9SJerome Glisse unsigned i, c; 919771fe6b9SJerome Glisse volatile uint32_t *ib; 920771fe6b9SJerome Glisse int r; 921771fe6b9SJerome Glisse 922771fe6b9SJerome Glisse ib = p->ib->ptr; 923771fe6b9SJerome Glisse ib_chunk = &p->chunks[p->chunk_ib_idx]; 924771fe6b9SJerome Glisse idx = pkt->idx + 1; 925771fe6b9SJerome Glisse switch (pkt->opcode) { 926771fe6b9SJerome Glisse case PACKET3_3D_LOAD_VBPNTR: 927771fe6b9SJerome Glisse c = ib_chunk->kdata[idx++]; 928771fe6b9SJerome Glisse for (i = 0; i < (c - 1); i += 2, idx += 3) { 929771fe6b9SJerome Glisse r = r100_cs_packet_next_reloc(p, &reloc); 930771fe6b9SJerome Glisse if (r) { 931771fe6b9SJerome Glisse DRM_ERROR("No reloc for packet3 %d\n", 932771fe6b9SJerome Glisse pkt->opcode); 933771fe6b9SJerome Glisse r100_cs_dump_packet(p, pkt); 934771fe6b9SJerome Glisse return r; 935771fe6b9SJerome Glisse } 936771fe6b9SJerome Glisse ib[idx+1] = ib_chunk->kdata[idx+1] + ((u32)reloc->lobj.gpu_offset); 937771fe6b9SJerome Glisse r = r100_cs_packet_next_reloc(p, &reloc); 938771fe6b9SJerome Glisse if (r) { 939771fe6b9SJerome Glisse DRM_ERROR("No reloc for packet3 %d\n", 940771fe6b9SJerome Glisse pkt->opcode); 941771fe6b9SJerome Glisse r100_cs_dump_packet(p, pkt); 942771fe6b9SJerome Glisse return r; 943771fe6b9SJerome Glisse } 944771fe6b9SJerome Glisse ib[idx+2] = ib_chunk->kdata[idx+2] + ((u32)reloc->lobj.gpu_offset); 945771fe6b9SJerome Glisse } 946771fe6b9SJerome Glisse if (c & 1) { 947771fe6b9SJerome Glisse r = r100_cs_packet_next_reloc(p, &reloc); 948771fe6b9SJerome Glisse if (r) { 949771fe6b9SJerome Glisse DRM_ERROR("No reloc for packet3 %d\n", 950771fe6b9SJerome Glisse pkt->opcode); 951771fe6b9SJerome Glisse r100_cs_dump_packet(p, pkt); 952771fe6b9SJerome Glisse return r; 953771fe6b9SJerome Glisse } 954771fe6b9SJerome Glisse ib[idx+1] = ib_chunk->kdata[idx+1] + ((u32)reloc->lobj.gpu_offset); 955771fe6b9SJerome Glisse } 956771fe6b9SJerome Glisse break; 957771fe6b9SJerome Glisse case PACKET3_INDX_BUFFER: 958771fe6b9SJerome Glisse r = r100_cs_packet_next_reloc(p, &reloc); 959771fe6b9SJerome Glisse if (r) { 960771fe6b9SJerome Glisse DRM_ERROR("No reloc for packet3 %d\n", pkt->opcode); 961771fe6b9SJerome Glisse r100_cs_dump_packet(p, pkt); 962771fe6b9SJerome Glisse return r; 963771fe6b9SJerome Glisse } 964771fe6b9SJerome Glisse ib[idx+1] = ib_chunk->kdata[idx+1] + ((u32)reloc->lobj.gpu_offset); 965068a117cSJerome Glisse r = r100_cs_track_check_pkt3_indx_buffer(p, pkt, reloc->robj); 966068a117cSJerome Glisse if (r) { 967068a117cSJerome Glisse return r; 968068a117cSJerome Glisse } 969771fe6b9SJerome Glisse break; 970771fe6b9SJerome Glisse case 0x23: 971771fe6b9SJerome Glisse /* FIXME: cleanup */ 972771fe6b9SJerome Glisse /* 3D_RNDR_GEN_INDX_PRIM on r100/r200 */ 973771fe6b9SJerome Glisse r = r100_cs_packet_next_reloc(p, &reloc); 974771fe6b9SJerome Glisse if (r) { 975771fe6b9SJerome Glisse DRM_ERROR("No reloc for packet3 %d\n", pkt->opcode); 976771fe6b9SJerome Glisse r100_cs_dump_packet(p, pkt); 977771fe6b9SJerome Glisse return r; 978771fe6b9SJerome Glisse } 979771fe6b9SJerome Glisse ib[idx] = ib_chunk->kdata[idx] + ((u32)reloc->lobj.gpu_offset); 980771fe6b9SJerome Glisse break; 981771fe6b9SJerome Glisse case PACKET3_3D_DRAW_IMMD: 982771fe6b9SJerome Glisse /* triggers drawing using in-packet vertex data */ 983771fe6b9SJerome Glisse case PACKET3_3D_DRAW_IMMD_2: 984771fe6b9SJerome Glisse /* triggers drawing using in-packet vertex data */ 985771fe6b9SJerome Glisse case PACKET3_3D_DRAW_VBUF_2: 986771fe6b9SJerome Glisse /* triggers drawing of vertex buffers setup elsewhere */ 987771fe6b9SJerome Glisse case PACKET3_3D_DRAW_INDX_2: 988771fe6b9SJerome Glisse /* triggers drawing using indices to vertex buffer */ 989771fe6b9SJerome Glisse case PACKET3_3D_DRAW_VBUF: 990771fe6b9SJerome Glisse /* triggers drawing of vertex buffers setup elsewhere */ 991771fe6b9SJerome Glisse case PACKET3_3D_DRAW_INDX: 992771fe6b9SJerome Glisse /* triggers drawing using indices to vertex buffer */ 993771fe6b9SJerome Glisse case PACKET3_NOP: 994771fe6b9SJerome Glisse break; 995771fe6b9SJerome Glisse default: 996771fe6b9SJerome Glisse DRM_ERROR("Packet3 opcode %x not supported\n", pkt->opcode); 997771fe6b9SJerome Glisse return -EINVAL; 998771fe6b9SJerome Glisse } 999771fe6b9SJerome Glisse return 0; 1000771fe6b9SJerome Glisse } 1001771fe6b9SJerome Glisse 1002771fe6b9SJerome Glisse int r100_cs_parse(struct radeon_cs_parser *p) 1003771fe6b9SJerome Glisse { 1004771fe6b9SJerome Glisse struct radeon_cs_packet pkt; 1005771fe6b9SJerome Glisse int r; 1006771fe6b9SJerome Glisse 1007771fe6b9SJerome Glisse do { 1008771fe6b9SJerome Glisse r = r100_cs_packet_parse(p, &pkt, p->idx); 1009771fe6b9SJerome Glisse if (r) { 1010771fe6b9SJerome Glisse return r; 1011771fe6b9SJerome Glisse } 1012771fe6b9SJerome Glisse p->idx += pkt.count + 2; 1013771fe6b9SJerome Glisse switch (pkt.type) { 1014771fe6b9SJerome Glisse case PACKET_TYPE0: 1015771fe6b9SJerome Glisse r = r100_packet0_check(p, &pkt); 1016771fe6b9SJerome Glisse break; 1017771fe6b9SJerome Glisse case PACKET_TYPE2: 1018771fe6b9SJerome Glisse break; 1019771fe6b9SJerome Glisse case PACKET_TYPE3: 1020771fe6b9SJerome Glisse r = r100_packet3_check(p, &pkt); 1021771fe6b9SJerome Glisse break; 1022771fe6b9SJerome Glisse default: 1023771fe6b9SJerome Glisse DRM_ERROR("Unknown packet type %d !\n", 1024771fe6b9SJerome Glisse pkt.type); 1025771fe6b9SJerome Glisse return -EINVAL; 1026771fe6b9SJerome Glisse } 1027771fe6b9SJerome Glisse if (r) { 1028771fe6b9SJerome Glisse return r; 1029771fe6b9SJerome Glisse } 1030771fe6b9SJerome Glisse } while (p->idx < p->chunks[p->chunk_ib_idx].length_dw); 1031771fe6b9SJerome Glisse return 0; 1032771fe6b9SJerome Glisse } 1033771fe6b9SJerome Glisse 1034771fe6b9SJerome Glisse 1035771fe6b9SJerome Glisse /* 1036771fe6b9SJerome Glisse * Global GPU functions 1037771fe6b9SJerome Glisse */ 1038771fe6b9SJerome Glisse void r100_errata(struct radeon_device *rdev) 1039771fe6b9SJerome Glisse { 1040771fe6b9SJerome Glisse rdev->pll_errata = 0; 1041771fe6b9SJerome Glisse 1042771fe6b9SJerome Glisse if (rdev->family == CHIP_RV200 || rdev->family == CHIP_RS200) { 1043771fe6b9SJerome Glisse rdev->pll_errata |= CHIP_ERRATA_PLL_DUMMYREADS; 1044771fe6b9SJerome Glisse } 1045771fe6b9SJerome Glisse 1046771fe6b9SJerome Glisse if (rdev->family == CHIP_RV100 || 1047771fe6b9SJerome Glisse rdev->family == CHIP_RS100 || 1048771fe6b9SJerome Glisse rdev->family == CHIP_RS200) { 1049771fe6b9SJerome Glisse rdev->pll_errata |= CHIP_ERRATA_PLL_DELAY; 1050771fe6b9SJerome Glisse } 1051771fe6b9SJerome Glisse } 1052771fe6b9SJerome Glisse 1053771fe6b9SJerome Glisse /* Wait for vertical sync on primary CRTC */ 1054771fe6b9SJerome Glisse void r100_gpu_wait_for_vsync(struct radeon_device *rdev) 1055771fe6b9SJerome Glisse { 1056771fe6b9SJerome Glisse uint32_t crtc_gen_cntl, tmp; 1057771fe6b9SJerome Glisse int i; 1058771fe6b9SJerome Glisse 1059771fe6b9SJerome Glisse crtc_gen_cntl = RREG32(RADEON_CRTC_GEN_CNTL); 1060771fe6b9SJerome Glisse if ((crtc_gen_cntl & RADEON_CRTC_DISP_REQ_EN_B) || 1061771fe6b9SJerome Glisse !(crtc_gen_cntl & RADEON_CRTC_EN)) { 1062771fe6b9SJerome Glisse return; 1063771fe6b9SJerome Glisse } 1064771fe6b9SJerome Glisse /* Clear the CRTC_VBLANK_SAVE bit */ 1065771fe6b9SJerome Glisse WREG32(RADEON_CRTC_STATUS, RADEON_CRTC_VBLANK_SAVE_CLEAR); 1066771fe6b9SJerome Glisse for (i = 0; i < rdev->usec_timeout; i++) { 1067771fe6b9SJerome Glisse tmp = RREG32(RADEON_CRTC_STATUS); 1068771fe6b9SJerome Glisse if (tmp & RADEON_CRTC_VBLANK_SAVE) { 1069771fe6b9SJerome Glisse return; 1070771fe6b9SJerome Glisse } 1071771fe6b9SJerome Glisse DRM_UDELAY(1); 1072771fe6b9SJerome Glisse } 1073771fe6b9SJerome Glisse } 1074771fe6b9SJerome Glisse 1075771fe6b9SJerome Glisse /* Wait for vertical sync on secondary CRTC */ 1076771fe6b9SJerome Glisse void r100_gpu_wait_for_vsync2(struct radeon_device *rdev) 1077771fe6b9SJerome Glisse { 1078771fe6b9SJerome Glisse uint32_t crtc2_gen_cntl, tmp; 1079771fe6b9SJerome Glisse int i; 1080771fe6b9SJerome Glisse 1081771fe6b9SJerome Glisse crtc2_gen_cntl = RREG32(RADEON_CRTC2_GEN_CNTL); 1082771fe6b9SJerome Glisse if ((crtc2_gen_cntl & RADEON_CRTC2_DISP_REQ_EN_B) || 1083771fe6b9SJerome Glisse !(crtc2_gen_cntl & RADEON_CRTC2_EN)) 1084771fe6b9SJerome Glisse return; 1085771fe6b9SJerome Glisse 1086771fe6b9SJerome Glisse /* Clear the CRTC_VBLANK_SAVE bit */ 1087771fe6b9SJerome Glisse WREG32(RADEON_CRTC2_STATUS, RADEON_CRTC2_VBLANK_SAVE_CLEAR); 1088771fe6b9SJerome Glisse for (i = 0; i < rdev->usec_timeout; i++) { 1089771fe6b9SJerome Glisse tmp = RREG32(RADEON_CRTC2_STATUS); 1090771fe6b9SJerome Glisse if (tmp & RADEON_CRTC2_VBLANK_SAVE) { 1091771fe6b9SJerome Glisse return; 1092771fe6b9SJerome Glisse } 1093771fe6b9SJerome Glisse DRM_UDELAY(1); 1094771fe6b9SJerome Glisse } 1095771fe6b9SJerome Glisse } 1096771fe6b9SJerome Glisse 1097771fe6b9SJerome Glisse int r100_rbbm_fifo_wait_for_entry(struct radeon_device *rdev, unsigned n) 1098771fe6b9SJerome Glisse { 1099771fe6b9SJerome Glisse unsigned i; 1100771fe6b9SJerome Glisse uint32_t tmp; 1101771fe6b9SJerome Glisse 1102771fe6b9SJerome Glisse for (i = 0; i < rdev->usec_timeout; i++) { 1103771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_STATUS) & RADEON_RBBM_FIFOCNT_MASK; 1104771fe6b9SJerome Glisse if (tmp >= n) { 1105771fe6b9SJerome Glisse return 0; 1106771fe6b9SJerome Glisse } 1107771fe6b9SJerome Glisse DRM_UDELAY(1); 1108771fe6b9SJerome Glisse } 1109771fe6b9SJerome Glisse return -1; 1110771fe6b9SJerome Glisse } 1111771fe6b9SJerome Glisse 1112771fe6b9SJerome Glisse int r100_gui_wait_for_idle(struct radeon_device *rdev) 1113771fe6b9SJerome Glisse { 1114771fe6b9SJerome Glisse unsigned i; 1115771fe6b9SJerome Glisse uint32_t tmp; 1116771fe6b9SJerome Glisse 1117771fe6b9SJerome Glisse if (r100_rbbm_fifo_wait_for_entry(rdev, 64)) { 1118771fe6b9SJerome Glisse printk(KERN_WARNING "radeon: wait for empty RBBM fifo failed !" 1119771fe6b9SJerome Glisse " Bad things might happen.\n"); 1120771fe6b9SJerome Glisse } 1121771fe6b9SJerome Glisse for (i = 0; i < rdev->usec_timeout; i++) { 1122771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_STATUS); 1123771fe6b9SJerome Glisse if (!(tmp & (1 << 31))) { 1124771fe6b9SJerome Glisse return 0; 1125771fe6b9SJerome Glisse } 1126771fe6b9SJerome Glisse DRM_UDELAY(1); 1127771fe6b9SJerome Glisse } 1128771fe6b9SJerome Glisse return -1; 1129771fe6b9SJerome Glisse } 1130771fe6b9SJerome Glisse 1131771fe6b9SJerome Glisse int r100_mc_wait_for_idle(struct radeon_device *rdev) 1132771fe6b9SJerome Glisse { 1133771fe6b9SJerome Glisse unsigned i; 1134771fe6b9SJerome Glisse uint32_t tmp; 1135771fe6b9SJerome Glisse 1136771fe6b9SJerome Glisse for (i = 0; i < rdev->usec_timeout; i++) { 1137771fe6b9SJerome Glisse /* read MC_STATUS */ 1138771fe6b9SJerome Glisse tmp = RREG32(0x0150); 1139771fe6b9SJerome Glisse if (tmp & (1 << 2)) { 1140771fe6b9SJerome Glisse return 0; 1141771fe6b9SJerome Glisse } 1142771fe6b9SJerome Glisse DRM_UDELAY(1); 1143771fe6b9SJerome Glisse } 1144771fe6b9SJerome Glisse return -1; 1145771fe6b9SJerome Glisse } 1146771fe6b9SJerome Glisse 1147771fe6b9SJerome Glisse void r100_gpu_init(struct radeon_device *rdev) 1148771fe6b9SJerome Glisse { 1149771fe6b9SJerome Glisse /* TODO: anythings to do here ? pipes ? */ 1150771fe6b9SJerome Glisse r100_hdp_reset(rdev); 1151771fe6b9SJerome Glisse } 1152771fe6b9SJerome Glisse 1153771fe6b9SJerome Glisse void r100_hdp_reset(struct radeon_device *rdev) 1154771fe6b9SJerome Glisse { 1155771fe6b9SJerome Glisse uint32_t tmp; 1156771fe6b9SJerome Glisse 1157771fe6b9SJerome Glisse tmp = RREG32(RADEON_HOST_PATH_CNTL) & RADEON_HDP_APER_CNTL; 1158771fe6b9SJerome Glisse tmp |= (7 << 28); 1159771fe6b9SJerome Glisse WREG32(RADEON_HOST_PATH_CNTL, tmp | RADEON_HDP_SOFT_RESET | RADEON_HDP_READ_BUFFER_INVALIDATE); 1160771fe6b9SJerome Glisse (void)RREG32(RADEON_HOST_PATH_CNTL); 1161771fe6b9SJerome Glisse udelay(200); 1162771fe6b9SJerome Glisse WREG32(RADEON_RBBM_SOFT_RESET, 0); 1163771fe6b9SJerome Glisse WREG32(RADEON_HOST_PATH_CNTL, tmp); 1164771fe6b9SJerome Glisse (void)RREG32(RADEON_HOST_PATH_CNTL); 1165771fe6b9SJerome Glisse } 1166771fe6b9SJerome Glisse 1167771fe6b9SJerome Glisse int r100_rb2d_reset(struct radeon_device *rdev) 1168771fe6b9SJerome Glisse { 1169771fe6b9SJerome Glisse uint32_t tmp; 1170771fe6b9SJerome Glisse int i; 1171771fe6b9SJerome Glisse 1172771fe6b9SJerome Glisse WREG32(RADEON_RBBM_SOFT_RESET, RADEON_SOFT_RESET_E2); 1173771fe6b9SJerome Glisse (void)RREG32(RADEON_RBBM_SOFT_RESET); 1174771fe6b9SJerome Glisse udelay(200); 1175771fe6b9SJerome Glisse WREG32(RADEON_RBBM_SOFT_RESET, 0); 1176771fe6b9SJerome Glisse /* Wait to prevent race in RBBM_STATUS */ 1177771fe6b9SJerome Glisse mdelay(1); 1178771fe6b9SJerome Glisse for (i = 0; i < rdev->usec_timeout; i++) { 1179771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_STATUS); 1180771fe6b9SJerome Glisse if (!(tmp & (1 << 26))) { 1181771fe6b9SJerome Glisse DRM_INFO("RB2D reset succeed (RBBM_STATUS=0x%08X)\n", 1182771fe6b9SJerome Glisse tmp); 1183771fe6b9SJerome Glisse return 0; 1184771fe6b9SJerome Glisse } 1185771fe6b9SJerome Glisse DRM_UDELAY(1); 1186771fe6b9SJerome Glisse } 1187771fe6b9SJerome Glisse tmp = RREG32(RADEON_RBBM_STATUS); 1188771fe6b9SJerome Glisse DRM_ERROR("Failed to reset RB2D (RBBM_STATUS=0x%08X)!\n", tmp); 1189771fe6b9SJerome Glisse return -1; 1190771fe6b9SJerome Glisse } 1191771fe6b9SJerome Glisse 1192771fe6b9SJerome Glisse int r100_gpu_reset(struct radeon_device *rdev) 1193771fe6b9SJerome Glisse { 1194771fe6b9SJerome Glisse uint32_t status; 1195771fe6b9SJerome Glisse 1196771fe6b9SJerome Glisse /* reset order likely matter */ 1197771fe6b9SJerome Glisse status = RREG32(RADEON_RBBM_STATUS); 1198771fe6b9SJerome Glisse /* reset HDP */ 1199771fe6b9SJerome Glisse r100_hdp_reset(rdev); 1200771fe6b9SJerome Glisse /* reset rb2d */ 1201771fe6b9SJerome Glisse if (status & ((1 << 17) | (1 << 18) | (1 << 27))) { 1202771fe6b9SJerome Glisse r100_rb2d_reset(rdev); 1203771fe6b9SJerome Glisse } 1204771fe6b9SJerome Glisse /* TODO: reset 3D engine */ 1205771fe6b9SJerome Glisse /* reset CP */ 1206771fe6b9SJerome Glisse status = RREG32(RADEON_RBBM_STATUS); 1207771fe6b9SJerome Glisse if (status & (1 << 16)) { 1208771fe6b9SJerome Glisse r100_cp_reset(rdev); 1209771fe6b9SJerome Glisse } 1210771fe6b9SJerome Glisse /* Check if GPU is idle */ 1211771fe6b9SJerome Glisse status = RREG32(RADEON_RBBM_STATUS); 1212771fe6b9SJerome Glisse if (status & (1 << 31)) { 1213771fe6b9SJerome Glisse DRM_ERROR("Failed to reset GPU (RBBM_STATUS=0x%08X)\n", status); 1214771fe6b9SJerome Glisse return -1; 1215771fe6b9SJerome Glisse } 1216771fe6b9SJerome Glisse DRM_INFO("GPU reset succeed (RBBM_STATUS=0x%08X)\n", status); 1217771fe6b9SJerome Glisse return 0; 1218771fe6b9SJerome Glisse } 1219771fe6b9SJerome Glisse 1220771fe6b9SJerome Glisse 1221771fe6b9SJerome Glisse /* 1222771fe6b9SJerome Glisse * VRAM info 1223771fe6b9SJerome Glisse */ 1224771fe6b9SJerome Glisse static void r100_vram_get_type(struct radeon_device *rdev) 1225771fe6b9SJerome Glisse { 1226771fe6b9SJerome Glisse uint32_t tmp; 1227771fe6b9SJerome Glisse 1228771fe6b9SJerome Glisse rdev->mc.vram_is_ddr = false; 1229771fe6b9SJerome Glisse if (rdev->flags & RADEON_IS_IGP) 1230771fe6b9SJerome Glisse rdev->mc.vram_is_ddr = true; 1231771fe6b9SJerome Glisse else if (RREG32(RADEON_MEM_SDRAM_MODE_REG) & RADEON_MEM_CFG_TYPE_DDR) 1232771fe6b9SJerome Glisse rdev->mc.vram_is_ddr = true; 1233771fe6b9SJerome Glisse if ((rdev->family == CHIP_RV100) || 1234771fe6b9SJerome Glisse (rdev->family == CHIP_RS100) || 1235771fe6b9SJerome Glisse (rdev->family == CHIP_RS200)) { 1236771fe6b9SJerome Glisse tmp = RREG32(RADEON_MEM_CNTL); 1237771fe6b9SJerome Glisse if (tmp & RV100_HALF_MODE) { 1238771fe6b9SJerome Glisse rdev->mc.vram_width = 32; 1239771fe6b9SJerome Glisse } else { 1240771fe6b9SJerome Glisse rdev->mc.vram_width = 64; 1241771fe6b9SJerome Glisse } 1242771fe6b9SJerome Glisse if (rdev->flags & RADEON_SINGLE_CRTC) { 1243771fe6b9SJerome Glisse rdev->mc.vram_width /= 4; 1244771fe6b9SJerome Glisse rdev->mc.vram_is_ddr = true; 1245771fe6b9SJerome Glisse } 1246771fe6b9SJerome Glisse } else if (rdev->family <= CHIP_RV280) { 1247771fe6b9SJerome Glisse tmp = RREG32(RADEON_MEM_CNTL); 1248771fe6b9SJerome Glisse if (tmp & RADEON_MEM_NUM_CHANNELS_MASK) { 1249771fe6b9SJerome Glisse rdev->mc.vram_width = 128; 1250771fe6b9SJerome Glisse } else { 1251771fe6b9SJerome Glisse rdev->mc.vram_width = 64; 1252771fe6b9SJerome Glisse } 1253771fe6b9SJerome Glisse } else { 1254771fe6b9SJerome Glisse /* newer IGPs */ 1255771fe6b9SJerome Glisse rdev->mc.vram_width = 128; 1256771fe6b9SJerome Glisse } 1257771fe6b9SJerome Glisse } 1258771fe6b9SJerome Glisse 1259771fe6b9SJerome Glisse void r100_vram_info(struct radeon_device *rdev) 1260771fe6b9SJerome Glisse { 1261771fe6b9SJerome Glisse r100_vram_get_type(rdev); 1262771fe6b9SJerome Glisse 1263771fe6b9SJerome Glisse if (rdev->flags & RADEON_IS_IGP) { 1264771fe6b9SJerome Glisse uint32_t tom; 1265771fe6b9SJerome Glisse /* read NB_TOM to get the amount of ram stolen for the GPU */ 1266771fe6b9SJerome Glisse tom = RREG32(RADEON_NB_TOM); 1267771fe6b9SJerome Glisse rdev->mc.vram_size = (((tom >> 16) - (tom & 0xffff) + 1) << 16); 1268771fe6b9SJerome Glisse WREG32(RADEON_CONFIG_MEMSIZE, rdev->mc.vram_size); 1269771fe6b9SJerome Glisse } else { 1270771fe6b9SJerome Glisse rdev->mc.vram_size = RREG32(RADEON_CONFIG_MEMSIZE); 1271771fe6b9SJerome Glisse /* Some production boards of m6 will report 0 1272771fe6b9SJerome Glisse * if it's 8 MB 1273771fe6b9SJerome Glisse */ 1274771fe6b9SJerome Glisse if (rdev->mc.vram_size == 0) { 1275771fe6b9SJerome Glisse rdev->mc.vram_size = 8192 * 1024; 1276771fe6b9SJerome Glisse WREG32(RADEON_CONFIG_MEMSIZE, rdev->mc.vram_size); 1277771fe6b9SJerome Glisse } 1278771fe6b9SJerome Glisse } 1279771fe6b9SJerome Glisse 1280771fe6b9SJerome Glisse rdev->mc.aper_base = drm_get_resource_start(rdev->ddev, 0); 1281771fe6b9SJerome Glisse rdev->mc.aper_size = drm_get_resource_len(rdev->ddev, 0); 1282771fe6b9SJerome Glisse } 1283771fe6b9SJerome Glisse 1284771fe6b9SJerome Glisse 1285771fe6b9SJerome Glisse /* 1286771fe6b9SJerome Glisse * Indirect registers accessor 1287771fe6b9SJerome Glisse */ 1288771fe6b9SJerome Glisse void r100_pll_errata_after_index(struct radeon_device *rdev) 1289771fe6b9SJerome Glisse { 1290771fe6b9SJerome Glisse if (!(rdev->pll_errata & CHIP_ERRATA_PLL_DUMMYREADS)) { 1291771fe6b9SJerome Glisse return; 1292771fe6b9SJerome Glisse } 1293771fe6b9SJerome Glisse (void)RREG32(RADEON_CLOCK_CNTL_DATA); 1294771fe6b9SJerome Glisse (void)RREG32(RADEON_CRTC_GEN_CNTL); 1295771fe6b9SJerome Glisse } 1296771fe6b9SJerome Glisse 1297771fe6b9SJerome Glisse static void r100_pll_errata_after_data(struct radeon_device *rdev) 1298771fe6b9SJerome Glisse { 1299771fe6b9SJerome Glisse /* This workarounds is necessary on RV100, RS100 and RS200 chips 1300771fe6b9SJerome Glisse * or the chip could hang on a subsequent access 1301771fe6b9SJerome Glisse */ 1302771fe6b9SJerome Glisse if (rdev->pll_errata & CHIP_ERRATA_PLL_DELAY) { 1303771fe6b9SJerome Glisse udelay(5000); 1304771fe6b9SJerome Glisse } 1305771fe6b9SJerome Glisse 1306771fe6b9SJerome Glisse /* This function is required to workaround a hardware bug in some (all?) 1307771fe6b9SJerome Glisse * revisions of the R300. This workaround should be called after every 1308771fe6b9SJerome Glisse * CLOCK_CNTL_INDEX register access. If not, register reads afterward 1309771fe6b9SJerome Glisse * may not be correct. 1310771fe6b9SJerome Glisse */ 1311771fe6b9SJerome Glisse if (rdev->pll_errata & CHIP_ERRATA_R300_CG) { 1312771fe6b9SJerome Glisse uint32_t save, tmp; 1313771fe6b9SJerome Glisse 1314771fe6b9SJerome Glisse save = RREG32(RADEON_CLOCK_CNTL_INDEX); 1315771fe6b9SJerome Glisse tmp = save & ~(0x3f | RADEON_PLL_WR_EN); 1316771fe6b9SJerome Glisse WREG32(RADEON_CLOCK_CNTL_INDEX, tmp); 1317771fe6b9SJerome Glisse tmp = RREG32(RADEON_CLOCK_CNTL_DATA); 1318771fe6b9SJerome Glisse WREG32(RADEON_CLOCK_CNTL_INDEX, save); 1319771fe6b9SJerome Glisse } 1320771fe6b9SJerome Glisse } 1321771fe6b9SJerome Glisse 1322771fe6b9SJerome Glisse uint32_t r100_pll_rreg(struct radeon_device *rdev, uint32_t reg) 1323771fe6b9SJerome Glisse { 1324771fe6b9SJerome Glisse uint32_t data; 1325771fe6b9SJerome Glisse 1326771fe6b9SJerome Glisse WREG8(RADEON_CLOCK_CNTL_INDEX, reg & 0x3f); 1327771fe6b9SJerome Glisse r100_pll_errata_after_index(rdev); 1328771fe6b9SJerome Glisse data = RREG32(RADEON_CLOCK_CNTL_DATA); 1329771fe6b9SJerome Glisse r100_pll_errata_after_data(rdev); 1330771fe6b9SJerome Glisse return data; 1331771fe6b9SJerome Glisse } 1332771fe6b9SJerome Glisse 1333771fe6b9SJerome Glisse void r100_pll_wreg(struct radeon_device *rdev, uint32_t reg, uint32_t v) 1334771fe6b9SJerome Glisse { 1335771fe6b9SJerome Glisse WREG8(RADEON_CLOCK_CNTL_INDEX, ((reg & 0x3f) | RADEON_PLL_WR_EN)); 1336771fe6b9SJerome Glisse r100_pll_errata_after_index(rdev); 1337771fe6b9SJerome Glisse WREG32(RADEON_CLOCK_CNTL_DATA, v); 1338771fe6b9SJerome Glisse r100_pll_errata_after_data(rdev); 1339771fe6b9SJerome Glisse } 1340771fe6b9SJerome Glisse 1341771fe6b9SJerome Glisse uint32_t r100_mm_rreg(struct radeon_device *rdev, uint32_t reg) 1342771fe6b9SJerome Glisse { 1343771fe6b9SJerome Glisse if (reg < 0x10000) 1344771fe6b9SJerome Glisse return readl(((void __iomem *)rdev->rmmio) + reg); 1345771fe6b9SJerome Glisse else { 1346771fe6b9SJerome Glisse writel(reg, ((void __iomem *)rdev->rmmio) + RADEON_MM_INDEX); 1347771fe6b9SJerome Glisse return readl(((void __iomem *)rdev->rmmio) + RADEON_MM_DATA); 1348771fe6b9SJerome Glisse } 1349771fe6b9SJerome Glisse } 1350771fe6b9SJerome Glisse 1351771fe6b9SJerome Glisse void r100_mm_wreg(struct radeon_device *rdev, uint32_t reg, uint32_t v) 1352771fe6b9SJerome Glisse { 1353771fe6b9SJerome Glisse if (reg < 0x10000) 1354771fe6b9SJerome Glisse writel(v, ((void __iomem *)rdev->rmmio) + reg); 1355771fe6b9SJerome Glisse else { 1356771fe6b9SJerome Glisse writel(reg, ((void __iomem *)rdev->rmmio) + RADEON_MM_INDEX); 1357771fe6b9SJerome Glisse writel(v, ((void __iomem *)rdev->rmmio) + RADEON_MM_DATA); 1358771fe6b9SJerome Glisse } 1359771fe6b9SJerome Glisse } 1360771fe6b9SJerome Glisse 1361068a117cSJerome Glisse int r100_init(struct radeon_device *rdev) 1362068a117cSJerome Glisse { 1363068a117cSJerome Glisse return 0; 1364068a117cSJerome Glisse } 1365068a117cSJerome Glisse 1366771fe6b9SJerome Glisse /* 1367771fe6b9SJerome Glisse * Debugfs info 1368771fe6b9SJerome Glisse */ 1369771fe6b9SJerome Glisse #if defined(CONFIG_DEBUG_FS) 1370771fe6b9SJerome Glisse static int r100_debugfs_rbbm_info(struct seq_file *m, void *data) 1371771fe6b9SJerome Glisse { 1372771fe6b9SJerome Glisse struct drm_info_node *node = (struct drm_info_node *) m->private; 1373771fe6b9SJerome Glisse struct drm_device *dev = node->minor->dev; 1374771fe6b9SJerome Glisse struct radeon_device *rdev = dev->dev_private; 1375771fe6b9SJerome Glisse uint32_t reg, value; 1376771fe6b9SJerome Glisse unsigned i; 1377771fe6b9SJerome Glisse 1378771fe6b9SJerome Glisse seq_printf(m, "RBBM_STATUS 0x%08x\n", RREG32(RADEON_RBBM_STATUS)); 1379771fe6b9SJerome Glisse seq_printf(m, "RBBM_CMDFIFO_STAT 0x%08x\n", RREG32(0xE7C)); 1380771fe6b9SJerome Glisse seq_printf(m, "CP_STAT 0x%08x\n", RREG32(RADEON_CP_STAT)); 1381771fe6b9SJerome Glisse for (i = 0; i < 64; i++) { 1382771fe6b9SJerome Glisse WREG32(RADEON_RBBM_CMDFIFO_ADDR, i | 0x100); 1383771fe6b9SJerome Glisse reg = (RREG32(RADEON_RBBM_CMDFIFO_DATA) - 1) >> 2; 1384771fe6b9SJerome Glisse WREG32(RADEON_RBBM_CMDFIFO_ADDR, i); 1385771fe6b9SJerome Glisse value = RREG32(RADEON_RBBM_CMDFIFO_DATA); 1386771fe6b9SJerome Glisse seq_printf(m, "[0x%03X] 0x%04X=0x%08X\n", i, reg, value); 1387771fe6b9SJerome Glisse } 1388771fe6b9SJerome Glisse return 0; 1389771fe6b9SJerome Glisse } 1390771fe6b9SJerome Glisse 1391771fe6b9SJerome Glisse static int r100_debugfs_cp_ring_info(struct seq_file *m, void *data) 1392771fe6b9SJerome Glisse { 1393771fe6b9SJerome Glisse struct drm_info_node *node = (struct drm_info_node *) m->private; 1394771fe6b9SJerome Glisse struct drm_device *dev = node->minor->dev; 1395771fe6b9SJerome Glisse struct radeon_device *rdev = dev->dev_private; 1396771fe6b9SJerome Glisse uint32_t rdp, wdp; 1397771fe6b9SJerome Glisse unsigned count, i, j; 1398771fe6b9SJerome Glisse 1399771fe6b9SJerome Glisse radeon_ring_free_size(rdev); 1400771fe6b9SJerome Glisse rdp = RREG32(RADEON_CP_RB_RPTR); 1401771fe6b9SJerome Glisse wdp = RREG32(RADEON_CP_RB_WPTR); 1402771fe6b9SJerome Glisse count = (rdp + rdev->cp.ring_size - wdp) & rdev->cp.ptr_mask; 1403771fe6b9SJerome Glisse seq_printf(m, "CP_STAT 0x%08x\n", RREG32(RADEON_CP_STAT)); 1404771fe6b9SJerome Glisse seq_printf(m, "CP_RB_WPTR 0x%08x\n", wdp); 1405771fe6b9SJerome Glisse seq_printf(m, "CP_RB_RPTR 0x%08x\n", rdp); 1406771fe6b9SJerome Glisse seq_printf(m, "%u free dwords in ring\n", rdev->cp.ring_free_dw); 1407771fe6b9SJerome Glisse seq_printf(m, "%u dwords in ring\n", count); 1408771fe6b9SJerome Glisse for (j = 0; j <= count; j++) { 1409771fe6b9SJerome Glisse i = (rdp + j) & rdev->cp.ptr_mask; 1410771fe6b9SJerome Glisse seq_printf(m, "r[%04d]=0x%08x\n", i, rdev->cp.ring[i]); 1411771fe6b9SJerome Glisse } 1412771fe6b9SJerome Glisse return 0; 1413771fe6b9SJerome Glisse } 1414771fe6b9SJerome Glisse 1415771fe6b9SJerome Glisse 1416771fe6b9SJerome Glisse static int r100_debugfs_cp_csq_fifo(struct seq_file *m, void *data) 1417771fe6b9SJerome Glisse { 1418771fe6b9SJerome Glisse struct drm_info_node *node = (struct drm_info_node *) m->private; 1419771fe6b9SJerome Glisse struct drm_device *dev = node->minor->dev; 1420771fe6b9SJerome Glisse struct radeon_device *rdev = dev->dev_private; 1421771fe6b9SJerome Glisse uint32_t csq_stat, csq2_stat, tmp; 1422771fe6b9SJerome Glisse unsigned r_rptr, r_wptr, ib1_rptr, ib1_wptr, ib2_rptr, ib2_wptr; 1423771fe6b9SJerome Glisse unsigned i; 1424771fe6b9SJerome Glisse 1425771fe6b9SJerome Glisse seq_printf(m, "CP_STAT 0x%08x\n", RREG32(RADEON_CP_STAT)); 1426771fe6b9SJerome Glisse seq_printf(m, "CP_CSQ_MODE 0x%08x\n", RREG32(RADEON_CP_CSQ_MODE)); 1427771fe6b9SJerome Glisse csq_stat = RREG32(RADEON_CP_CSQ_STAT); 1428771fe6b9SJerome Glisse csq2_stat = RREG32(RADEON_CP_CSQ2_STAT); 1429771fe6b9SJerome Glisse r_rptr = (csq_stat >> 0) & 0x3ff; 1430771fe6b9SJerome Glisse r_wptr = (csq_stat >> 10) & 0x3ff; 1431771fe6b9SJerome Glisse ib1_rptr = (csq_stat >> 20) & 0x3ff; 1432771fe6b9SJerome Glisse ib1_wptr = (csq2_stat >> 0) & 0x3ff; 1433771fe6b9SJerome Glisse ib2_rptr = (csq2_stat >> 10) & 0x3ff; 1434771fe6b9SJerome Glisse ib2_wptr = (csq2_stat >> 20) & 0x3ff; 1435771fe6b9SJerome Glisse seq_printf(m, "CP_CSQ_STAT 0x%08x\n", csq_stat); 1436771fe6b9SJerome Glisse seq_printf(m, "CP_CSQ2_STAT 0x%08x\n", csq2_stat); 1437771fe6b9SJerome Glisse seq_printf(m, "Ring rptr %u\n", r_rptr); 1438771fe6b9SJerome Glisse seq_printf(m, "Ring wptr %u\n", r_wptr); 1439771fe6b9SJerome Glisse seq_printf(m, "Indirect1 rptr %u\n", ib1_rptr); 1440771fe6b9SJerome Glisse seq_printf(m, "Indirect1 wptr %u\n", ib1_wptr); 1441771fe6b9SJerome Glisse seq_printf(m, "Indirect2 rptr %u\n", ib2_rptr); 1442771fe6b9SJerome Glisse seq_printf(m, "Indirect2 wptr %u\n", ib2_wptr); 1443771fe6b9SJerome Glisse /* FIXME: 0, 128, 640 depends on fifo setup see cp_init_kms 1444771fe6b9SJerome Glisse * 128 = indirect1_start * 8 & 640 = indirect2_start * 8 */ 1445771fe6b9SJerome Glisse seq_printf(m, "Ring fifo:\n"); 1446771fe6b9SJerome Glisse for (i = 0; i < 256; i++) { 1447771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_ADDR, i << 2); 1448771fe6b9SJerome Glisse tmp = RREG32(RADEON_CP_CSQ_DATA); 1449771fe6b9SJerome Glisse seq_printf(m, "rfifo[%04d]=0x%08X\n", i, tmp); 1450771fe6b9SJerome Glisse } 1451771fe6b9SJerome Glisse seq_printf(m, "Indirect1 fifo:\n"); 1452771fe6b9SJerome Glisse for (i = 256; i <= 512; i++) { 1453771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_ADDR, i << 2); 1454771fe6b9SJerome Glisse tmp = RREG32(RADEON_CP_CSQ_DATA); 1455771fe6b9SJerome Glisse seq_printf(m, "ib1fifo[%04d]=0x%08X\n", i, tmp); 1456771fe6b9SJerome Glisse } 1457771fe6b9SJerome Glisse seq_printf(m, "Indirect2 fifo:\n"); 1458771fe6b9SJerome Glisse for (i = 640; i < ib1_wptr; i++) { 1459771fe6b9SJerome Glisse WREG32(RADEON_CP_CSQ_ADDR, i << 2); 1460771fe6b9SJerome Glisse tmp = RREG32(RADEON_CP_CSQ_DATA); 1461771fe6b9SJerome Glisse seq_printf(m, "ib2fifo[%04d]=0x%08X\n", i, tmp); 1462771fe6b9SJerome Glisse } 1463771fe6b9SJerome Glisse return 0; 1464771fe6b9SJerome Glisse } 1465771fe6b9SJerome Glisse 1466771fe6b9SJerome Glisse static int r100_debugfs_mc_info(struct seq_file *m, void *data) 1467771fe6b9SJerome Glisse { 1468771fe6b9SJerome Glisse struct drm_info_node *node = (struct drm_info_node *) m->private; 1469771fe6b9SJerome Glisse struct drm_device *dev = node->minor->dev; 1470771fe6b9SJerome Glisse struct radeon_device *rdev = dev->dev_private; 1471771fe6b9SJerome Glisse uint32_t tmp; 1472771fe6b9SJerome Glisse 1473771fe6b9SJerome Glisse tmp = RREG32(RADEON_CONFIG_MEMSIZE); 1474771fe6b9SJerome Glisse seq_printf(m, "CONFIG_MEMSIZE 0x%08x\n", tmp); 1475771fe6b9SJerome Glisse tmp = RREG32(RADEON_MC_FB_LOCATION); 1476771fe6b9SJerome Glisse seq_printf(m, "MC_FB_LOCATION 0x%08x\n", tmp); 1477771fe6b9SJerome Glisse tmp = RREG32(RADEON_BUS_CNTL); 1478771fe6b9SJerome Glisse seq_printf(m, "BUS_CNTL 0x%08x\n", tmp); 1479771fe6b9SJerome Glisse tmp = RREG32(RADEON_MC_AGP_LOCATION); 1480771fe6b9SJerome Glisse seq_printf(m, "MC_AGP_LOCATION 0x%08x\n", tmp); 1481771fe6b9SJerome Glisse tmp = RREG32(RADEON_AGP_BASE); 1482771fe6b9SJerome Glisse seq_printf(m, "AGP_BASE 0x%08x\n", tmp); 1483771fe6b9SJerome Glisse tmp = RREG32(RADEON_HOST_PATH_CNTL); 1484771fe6b9SJerome Glisse seq_printf(m, "HOST_PATH_CNTL 0x%08x\n", tmp); 1485771fe6b9SJerome Glisse tmp = RREG32(0x01D0); 1486771fe6b9SJerome Glisse seq_printf(m, "AIC_CTRL 0x%08x\n", tmp); 1487771fe6b9SJerome Glisse tmp = RREG32(RADEON_AIC_LO_ADDR); 1488771fe6b9SJerome Glisse seq_printf(m, "AIC_LO_ADDR 0x%08x\n", tmp); 1489771fe6b9SJerome Glisse tmp = RREG32(RADEON_AIC_HI_ADDR); 1490771fe6b9SJerome Glisse seq_printf(m, "AIC_HI_ADDR 0x%08x\n", tmp); 1491771fe6b9SJerome Glisse tmp = RREG32(0x01E4); 1492771fe6b9SJerome Glisse seq_printf(m, "AIC_TLB_ADDR 0x%08x\n", tmp); 1493771fe6b9SJerome Glisse return 0; 1494771fe6b9SJerome Glisse } 1495771fe6b9SJerome Glisse 1496771fe6b9SJerome Glisse static struct drm_info_list r100_debugfs_rbbm_list[] = { 1497771fe6b9SJerome Glisse {"r100_rbbm_info", r100_debugfs_rbbm_info, 0, NULL}, 1498771fe6b9SJerome Glisse }; 1499771fe6b9SJerome Glisse 1500771fe6b9SJerome Glisse static struct drm_info_list r100_debugfs_cp_list[] = { 1501771fe6b9SJerome Glisse {"r100_cp_ring_info", r100_debugfs_cp_ring_info, 0, NULL}, 1502771fe6b9SJerome Glisse {"r100_cp_csq_fifo", r100_debugfs_cp_csq_fifo, 0, NULL}, 1503771fe6b9SJerome Glisse }; 1504771fe6b9SJerome Glisse 1505771fe6b9SJerome Glisse static struct drm_info_list r100_debugfs_mc_info_list[] = { 1506771fe6b9SJerome Glisse {"r100_mc_info", r100_debugfs_mc_info, 0, NULL}, 1507771fe6b9SJerome Glisse }; 1508771fe6b9SJerome Glisse #endif 1509771fe6b9SJerome Glisse 1510771fe6b9SJerome Glisse int r100_debugfs_rbbm_init(struct radeon_device *rdev) 1511771fe6b9SJerome Glisse { 1512771fe6b9SJerome Glisse #if defined(CONFIG_DEBUG_FS) 1513771fe6b9SJerome Glisse return radeon_debugfs_add_files(rdev, r100_debugfs_rbbm_list, 1); 1514771fe6b9SJerome Glisse #else 1515771fe6b9SJerome Glisse return 0; 1516771fe6b9SJerome Glisse #endif 1517771fe6b9SJerome Glisse } 1518771fe6b9SJerome Glisse 1519771fe6b9SJerome Glisse int r100_debugfs_cp_init(struct radeon_device *rdev) 1520771fe6b9SJerome Glisse { 1521771fe6b9SJerome Glisse #if defined(CONFIG_DEBUG_FS) 1522771fe6b9SJerome Glisse return radeon_debugfs_add_files(rdev, r100_debugfs_cp_list, 2); 1523771fe6b9SJerome Glisse #else 1524771fe6b9SJerome Glisse return 0; 1525771fe6b9SJerome Glisse #endif 1526771fe6b9SJerome Glisse } 1527771fe6b9SJerome Glisse 1528771fe6b9SJerome Glisse int r100_debugfs_mc_info_init(struct radeon_device *rdev) 1529771fe6b9SJerome Glisse { 1530771fe6b9SJerome Glisse #if defined(CONFIG_DEBUG_FS) 1531771fe6b9SJerome Glisse return radeon_debugfs_add_files(rdev, r100_debugfs_mc_info_list, 1); 1532771fe6b9SJerome Glisse #else 1533771fe6b9SJerome Glisse return 0; 1534771fe6b9SJerome Glisse #endif 1535771fe6b9SJerome Glisse } 1536