1f8c55dc6SChristoph Hellwig // SPDX-License-Identifier: GPL-2.0 2f8c55dc6SChristoph Hellwig /* 3f8c55dc6SChristoph Hellwig * Copyright (C) 2000 Ani Joshi <ajoshi@unixbox.com> 4f8c55dc6SChristoph Hellwig * Copyright (C) 2000, 2001, 06 Ralf Baechle <ralf@linux-mips.org> 5f8c55dc6SChristoph Hellwig * swiped from i386, and cloned for MIPS by Geert, polished by Ralf. 6f8c55dc6SChristoph Hellwig */ 7f8c55dc6SChristoph Hellwig #include <linux/dma-direct.h> 8*0a0f0d8bSChristoph Hellwig #include <linux/dma-map-ops.h> 9f8c55dc6SChristoph Hellwig #include <linux/dma-noncoherent.h> 10f8c55dc6SChristoph Hellwig #include <linux/dma-contiguous.h> 11f8c55dc6SChristoph Hellwig #include <linux/highmem.h> 12f8c55dc6SChristoph Hellwig 13f8c55dc6SChristoph Hellwig #include <asm/cache.h> 14f8c55dc6SChristoph Hellwig #include <asm/cpu-type.h> 15f8c55dc6SChristoph Hellwig #include <asm/dma-coherence.h> 16f8c55dc6SChristoph Hellwig #include <asm/io.h> 17f8c55dc6SChristoph Hellwig 18f8c55dc6SChristoph Hellwig /* 19f8c55dc6SChristoph Hellwig * The affected CPUs below in 'cpu_needs_post_dma_flush()' can speculatively 20f8c55dc6SChristoph Hellwig * fill random cachelines with stale data at any time, requiring an extra 21f8c55dc6SChristoph Hellwig * flush post-DMA. 22f8c55dc6SChristoph Hellwig * 23f8c55dc6SChristoph Hellwig * Warning on the terminology - Linux calls an uncached area coherent; MIPS 24f8c55dc6SChristoph Hellwig * terminology calls memory areas with hardware maintained coherency coherent. 25f8c55dc6SChristoph Hellwig * 26f8c55dc6SChristoph Hellwig * Note that the R14000 and R16000 should also be checked for in this condition. 27f8c55dc6SChristoph Hellwig * However this function is only called on non-I/O-coherent systems and only the 28f8c55dc6SChristoph Hellwig * R10000 and R12000 are used in such systems, the SGI IP28 Indigo² rsp. 29f8c55dc6SChristoph Hellwig * SGI IP32 aka O2. 30f8c55dc6SChristoph Hellwig */ 3156e35f9cSChristoph Hellwig static inline bool cpu_needs_post_dma_flush(void) 32f8c55dc6SChristoph Hellwig { 33f8c55dc6SChristoph Hellwig switch (boot_cpu_type()) { 34f8c55dc6SChristoph Hellwig case CPU_R10000: 35f8c55dc6SChristoph Hellwig case CPU_R12000: 36f8c55dc6SChristoph Hellwig case CPU_BMIPS5000: 37a202bf71SLichao Liu case CPU_LOONGSON2EF: 38f8c55dc6SChristoph Hellwig return true; 39f8c55dc6SChristoph Hellwig default: 40f8c55dc6SChristoph Hellwig /* 41f8c55dc6SChristoph Hellwig * Presence of MAARs suggests that the CPU supports 42f8c55dc6SChristoph Hellwig * speculatively prefetching data, and therefore requires 43f8c55dc6SChristoph Hellwig * the post-DMA flush/invalidate. 44f8c55dc6SChristoph Hellwig */ 45f8c55dc6SChristoph Hellwig return cpu_has_maar; 46f8c55dc6SChristoph Hellwig } 47f8c55dc6SChristoph Hellwig } 48f8c55dc6SChristoph Hellwig 492e96e04dSChristoph Hellwig void arch_dma_prep_coherent(struct page *page, size_t size) 50f8c55dc6SChristoph Hellwig { 512e96e04dSChristoph Hellwig dma_cache_wback_inv((unsigned long)page_address(page), size); 52f8c55dc6SChristoph Hellwig } 53f8c55dc6SChristoph Hellwig 54fa7e2247SChristoph Hellwig void *arch_dma_set_uncached(void *addr, size_t size) 552e96e04dSChristoph Hellwig { 562e96e04dSChristoph Hellwig return (void *)(__pa(addr) + UNCAC_BASE); 57f8c55dc6SChristoph Hellwig } 58f8c55dc6SChristoph Hellwig 59cbf1449bSChristoph Hellwig static inline void dma_sync_virt_for_device(void *addr, size_t size, 60f8c55dc6SChristoph Hellwig enum dma_data_direction dir) 61f8c55dc6SChristoph Hellwig { 62f8c55dc6SChristoph Hellwig switch (dir) { 63f8c55dc6SChristoph Hellwig case DMA_TO_DEVICE: 64f8c55dc6SChristoph Hellwig dma_cache_wback((unsigned long)addr, size); 65f8c55dc6SChristoph Hellwig break; 66f8c55dc6SChristoph Hellwig case DMA_FROM_DEVICE: 67f8c55dc6SChristoph Hellwig dma_cache_inv((unsigned long)addr, size); 68f8c55dc6SChristoph Hellwig break; 69f8c55dc6SChristoph Hellwig case DMA_BIDIRECTIONAL: 70f8c55dc6SChristoph Hellwig dma_cache_wback_inv((unsigned long)addr, size); 71f8c55dc6SChristoph Hellwig break; 72cbf1449bSChristoph Hellwig default: 73cbf1449bSChristoph Hellwig BUG(); 74cbf1449bSChristoph Hellwig } 75cbf1449bSChristoph Hellwig } 76f8c55dc6SChristoph Hellwig 77cbf1449bSChristoph Hellwig static inline void dma_sync_virt_for_cpu(void *addr, size_t size, 78cbf1449bSChristoph Hellwig enum dma_data_direction dir) 79cbf1449bSChristoph Hellwig { 80cbf1449bSChristoph Hellwig switch (dir) { 81cbf1449bSChristoph Hellwig case DMA_TO_DEVICE: 82cbf1449bSChristoph Hellwig break; 83cbf1449bSChristoph Hellwig case DMA_FROM_DEVICE: 84cbf1449bSChristoph Hellwig case DMA_BIDIRECTIONAL: 85cbf1449bSChristoph Hellwig dma_cache_inv((unsigned long)addr, size); 86cbf1449bSChristoph Hellwig break; 87f8c55dc6SChristoph Hellwig default: 88f8c55dc6SChristoph Hellwig BUG(); 89f8c55dc6SChristoph Hellwig } 90f8c55dc6SChristoph Hellwig } 91f8c55dc6SChristoph Hellwig 92f8c55dc6SChristoph Hellwig /* 93f8c55dc6SChristoph Hellwig * A single sg entry may refer to multiple physically contiguous pages. But 94f8c55dc6SChristoph Hellwig * we still need to process highmem pages individually. If highmem is not 95f8c55dc6SChristoph Hellwig * configured then the bulk of this loop gets optimized out. 96f8c55dc6SChristoph Hellwig */ 97f8c55dc6SChristoph Hellwig static inline void dma_sync_phys(phys_addr_t paddr, size_t size, 98cbf1449bSChristoph Hellwig enum dma_data_direction dir, bool for_device) 99f8c55dc6SChristoph Hellwig { 100f8c55dc6SChristoph Hellwig struct page *page = pfn_to_page(paddr >> PAGE_SHIFT); 101f8c55dc6SChristoph Hellwig unsigned long offset = paddr & ~PAGE_MASK; 102f8c55dc6SChristoph Hellwig size_t left = size; 103f8c55dc6SChristoph Hellwig 104f8c55dc6SChristoph Hellwig do { 105f8c55dc6SChristoph Hellwig size_t len = left; 106f8c55dc6SChristoph Hellwig void *addr; 107f8c55dc6SChristoph Hellwig 108cbf1449bSChristoph Hellwig if (PageHighMem(page)) { 109d411da06SPaul Burton if (offset + len > PAGE_SIZE) 110f8c55dc6SChristoph Hellwig len = PAGE_SIZE - offset; 111cbf1449bSChristoph Hellwig } 112f8c55dc6SChristoph Hellwig 113f8c55dc6SChristoph Hellwig addr = kmap_atomic(page); 114cbf1449bSChristoph Hellwig if (for_device) 115cbf1449bSChristoph Hellwig dma_sync_virt_for_device(addr + offset, len, dir); 116cbf1449bSChristoph Hellwig else 117cbf1449bSChristoph Hellwig dma_sync_virt_for_cpu(addr + offset, len, dir); 118f8c55dc6SChristoph Hellwig kunmap_atomic(addr); 119cbf1449bSChristoph Hellwig 120f8c55dc6SChristoph Hellwig offset = 0; 121f8c55dc6SChristoph Hellwig page++; 122f8c55dc6SChristoph Hellwig left -= len; 123f8c55dc6SChristoph Hellwig } while (left); 124f8c55dc6SChristoph Hellwig } 125f8c55dc6SChristoph Hellwig 12656e35f9cSChristoph Hellwig void arch_sync_dma_for_device(phys_addr_t paddr, size_t size, 12756e35f9cSChristoph Hellwig enum dma_data_direction dir) 128f8c55dc6SChristoph Hellwig { 129cbf1449bSChristoph Hellwig dma_sync_phys(paddr, size, dir, true); 130f8c55dc6SChristoph Hellwig } 131f8c55dc6SChristoph Hellwig 132f263f2a2SHauke Mehrtens #ifdef CONFIG_ARCH_HAS_SYNC_DMA_FOR_CPU 13356e35f9cSChristoph Hellwig void arch_sync_dma_for_cpu(phys_addr_t paddr, size_t size, 13456e35f9cSChristoph Hellwig enum dma_data_direction dir) 135f8c55dc6SChristoph Hellwig { 13656e35f9cSChristoph Hellwig if (cpu_needs_post_dma_flush()) 137cbf1449bSChristoph Hellwig dma_sync_phys(paddr, size, dir, false); 138f8c55dc6SChristoph Hellwig } 139f263f2a2SHauke Mehrtens #endif 140f8c55dc6SChristoph Hellwig 141347cb6afSChristoph Hellwig #ifdef CONFIG_DMA_PERDEV_COHERENT 142347cb6afSChristoph Hellwig void arch_setup_dma_ops(struct device *dev, u64 dma_base, u64 size, 143347cb6afSChristoph Hellwig const struct iommu_ops *iommu, bool coherent) 144347cb6afSChristoph Hellwig { 145347cb6afSChristoph Hellwig dev->dma_coherent = coherent; 146347cb6afSChristoph Hellwig } 147347cb6afSChristoph Hellwig #endif 148