xref: /openbmc/linux/arch/mips/mm/dma-noncoherent.c (revision 0a0f0d8be76dcd4390ff538e7060fda34db79717)
1f8c55dc6SChristoph Hellwig // SPDX-License-Identifier: GPL-2.0
2f8c55dc6SChristoph Hellwig /*
3f8c55dc6SChristoph Hellwig  * Copyright (C) 2000  Ani Joshi <ajoshi@unixbox.com>
4f8c55dc6SChristoph Hellwig  * Copyright (C) 2000, 2001, 06	 Ralf Baechle <ralf@linux-mips.org>
5f8c55dc6SChristoph Hellwig  * swiped from i386, and cloned for MIPS by Geert, polished by Ralf.
6f8c55dc6SChristoph Hellwig  */
7f8c55dc6SChristoph Hellwig #include <linux/dma-direct.h>
8*0a0f0d8bSChristoph Hellwig #include <linux/dma-map-ops.h>
9f8c55dc6SChristoph Hellwig #include <linux/dma-noncoherent.h>
10f8c55dc6SChristoph Hellwig #include <linux/dma-contiguous.h>
11f8c55dc6SChristoph Hellwig #include <linux/highmem.h>
12f8c55dc6SChristoph Hellwig 
13f8c55dc6SChristoph Hellwig #include <asm/cache.h>
14f8c55dc6SChristoph Hellwig #include <asm/cpu-type.h>
15f8c55dc6SChristoph Hellwig #include <asm/dma-coherence.h>
16f8c55dc6SChristoph Hellwig #include <asm/io.h>
17f8c55dc6SChristoph Hellwig 
18f8c55dc6SChristoph Hellwig /*
19f8c55dc6SChristoph Hellwig  * The affected CPUs below in 'cpu_needs_post_dma_flush()' can speculatively
20f8c55dc6SChristoph Hellwig  * fill random cachelines with stale data at any time, requiring an extra
21f8c55dc6SChristoph Hellwig  * flush post-DMA.
22f8c55dc6SChristoph Hellwig  *
23f8c55dc6SChristoph Hellwig  * Warning on the terminology - Linux calls an uncached area coherent;  MIPS
24f8c55dc6SChristoph Hellwig  * terminology calls memory areas with hardware maintained coherency coherent.
25f8c55dc6SChristoph Hellwig  *
26f8c55dc6SChristoph Hellwig  * Note that the R14000 and R16000 should also be checked for in this condition.
27f8c55dc6SChristoph Hellwig  * However this function is only called on non-I/O-coherent systems and only the
28f8c55dc6SChristoph Hellwig  * R10000 and R12000 are used in such systems, the SGI IP28 Indigo² rsp.
29f8c55dc6SChristoph Hellwig  * SGI IP32 aka O2.
30f8c55dc6SChristoph Hellwig  */
3156e35f9cSChristoph Hellwig static inline bool cpu_needs_post_dma_flush(void)
32f8c55dc6SChristoph Hellwig {
33f8c55dc6SChristoph Hellwig 	switch (boot_cpu_type()) {
34f8c55dc6SChristoph Hellwig 	case CPU_R10000:
35f8c55dc6SChristoph Hellwig 	case CPU_R12000:
36f8c55dc6SChristoph Hellwig 	case CPU_BMIPS5000:
37a202bf71SLichao Liu 	case CPU_LOONGSON2EF:
38f8c55dc6SChristoph Hellwig 		return true;
39f8c55dc6SChristoph Hellwig 	default:
40f8c55dc6SChristoph Hellwig 		/*
41f8c55dc6SChristoph Hellwig 		 * Presence of MAARs suggests that the CPU supports
42f8c55dc6SChristoph Hellwig 		 * speculatively prefetching data, and therefore requires
43f8c55dc6SChristoph Hellwig 		 * the post-DMA flush/invalidate.
44f8c55dc6SChristoph Hellwig 		 */
45f8c55dc6SChristoph Hellwig 		return cpu_has_maar;
46f8c55dc6SChristoph Hellwig 	}
47f8c55dc6SChristoph Hellwig }
48f8c55dc6SChristoph Hellwig 
492e96e04dSChristoph Hellwig void arch_dma_prep_coherent(struct page *page, size_t size)
50f8c55dc6SChristoph Hellwig {
512e96e04dSChristoph Hellwig 	dma_cache_wback_inv((unsigned long)page_address(page), size);
52f8c55dc6SChristoph Hellwig }
53f8c55dc6SChristoph Hellwig 
54fa7e2247SChristoph Hellwig void *arch_dma_set_uncached(void *addr, size_t size)
552e96e04dSChristoph Hellwig {
562e96e04dSChristoph Hellwig 	return (void *)(__pa(addr) + UNCAC_BASE);
57f8c55dc6SChristoph Hellwig }
58f8c55dc6SChristoph Hellwig 
59cbf1449bSChristoph Hellwig static inline void dma_sync_virt_for_device(void *addr, size_t size,
60f8c55dc6SChristoph Hellwig 		enum dma_data_direction dir)
61f8c55dc6SChristoph Hellwig {
62f8c55dc6SChristoph Hellwig 	switch (dir) {
63f8c55dc6SChristoph Hellwig 	case DMA_TO_DEVICE:
64f8c55dc6SChristoph Hellwig 		dma_cache_wback((unsigned long)addr, size);
65f8c55dc6SChristoph Hellwig 		break;
66f8c55dc6SChristoph Hellwig 	case DMA_FROM_DEVICE:
67f8c55dc6SChristoph Hellwig 		dma_cache_inv((unsigned long)addr, size);
68f8c55dc6SChristoph Hellwig 		break;
69f8c55dc6SChristoph Hellwig 	case DMA_BIDIRECTIONAL:
70f8c55dc6SChristoph Hellwig 		dma_cache_wback_inv((unsigned long)addr, size);
71f8c55dc6SChristoph Hellwig 		break;
72cbf1449bSChristoph Hellwig 	default:
73cbf1449bSChristoph Hellwig 		BUG();
74cbf1449bSChristoph Hellwig 	}
75cbf1449bSChristoph Hellwig }
76f8c55dc6SChristoph Hellwig 
77cbf1449bSChristoph Hellwig static inline void dma_sync_virt_for_cpu(void *addr, size_t size,
78cbf1449bSChristoph Hellwig 		enum dma_data_direction dir)
79cbf1449bSChristoph Hellwig {
80cbf1449bSChristoph Hellwig 	switch (dir) {
81cbf1449bSChristoph Hellwig 	case DMA_TO_DEVICE:
82cbf1449bSChristoph Hellwig 		break;
83cbf1449bSChristoph Hellwig 	case DMA_FROM_DEVICE:
84cbf1449bSChristoph Hellwig 	case DMA_BIDIRECTIONAL:
85cbf1449bSChristoph Hellwig 		dma_cache_inv((unsigned long)addr, size);
86cbf1449bSChristoph Hellwig 		break;
87f8c55dc6SChristoph Hellwig 	default:
88f8c55dc6SChristoph Hellwig 		BUG();
89f8c55dc6SChristoph Hellwig 	}
90f8c55dc6SChristoph Hellwig }
91f8c55dc6SChristoph Hellwig 
92f8c55dc6SChristoph Hellwig /*
93f8c55dc6SChristoph Hellwig  * A single sg entry may refer to multiple physically contiguous pages.  But
94f8c55dc6SChristoph Hellwig  * we still need to process highmem pages individually.  If highmem is not
95f8c55dc6SChristoph Hellwig  * configured then the bulk of this loop gets optimized out.
96f8c55dc6SChristoph Hellwig  */
97f8c55dc6SChristoph Hellwig static inline void dma_sync_phys(phys_addr_t paddr, size_t size,
98cbf1449bSChristoph Hellwig 		enum dma_data_direction dir, bool for_device)
99f8c55dc6SChristoph Hellwig {
100f8c55dc6SChristoph Hellwig 	struct page *page = pfn_to_page(paddr >> PAGE_SHIFT);
101f8c55dc6SChristoph Hellwig 	unsigned long offset = paddr & ~PAGE_MASK;
102f8c55dc6SChristoph Hellwig 	size_t left = size;
103f8c55dc6SChristoph Hellwig 
104f8c55dc6SChristoph Hellwig 	do {
105f8c55dc6SChristoph Hellwig 		size_t len = left;
106f8c55dc6SChristoph Hellwig 		void *addr;
107f8c55dc6SChristoph Hellwig 
108cbf1449bSChristoph Hellwig 		if (PageHighMem(page)) {
109d411da06SPaul Burton 			if (offset + len > PAGE_SIZE)
110f8c55dc6SChristoph Hellwig 				len = PAGE_SIZE - offset;
111cbf1449bSChristoph Hellwig 		}
112f8c55dc6SChristoph Hellwig 
113f8c55dc6SChristoph Hellwig 		addr = kmap_atomic(page);
114cbf1449bSChristoph Hellwig 		if (for_device)
115cbf1449bSChristoph Hellwig 			dma_sync_virt_for_device(addr + offset, len, dir);
116cbf1449bSChristoph Hellwig 		else
117cbf1449bSChristoph Hellwig 			dma_sync_virt_for_cpu(addr + offset, len, dir);
118f8c55dc6SChristoph Hellwig 		kunmap_atomic(addr);
119cbf1449bSChristoph Hellwig 
120f8c55dc6SChristoph Hellwig 		offset = 0;
121f8c55dc6SChristoph Hellwig 		page++;
122f8c55dc6SChristoph Hellwig 		left -= len;
123f8c55dc6SChristoph Hellwig 	} while (left);
124f8c55dc6SChristoph Hellwig }
125f8c55dc6SChristoph Hellwig 
12656e35f9cSChristoph Hellwig void arch_sync_dma_for_device(phys_addr_t paddr, size_t size,
12756e35f9cSChristoph Hellwig 		enum dma_data_direction dir)
128f8c55dc6SChristoph Hellwig {
129cbf1449bSChristoph Hellwig 	dma_sync_phys(paddr, size, dir, true);
130f8c55dc6SChristoph Hellwig }
131f8c55dc6SChristoph Hellwig 
132f263f2a2SHauke Mehrtens #ifdef CONFIG_ARCH_HAS_SYNC_DMA_FOR_CPU
13356e35f9cSChristoph Hellwig void arch_sync_dma_for_cpu(phys_addr_t paddr, size_t size,
13456e35f9cSChristoph Hellwig 		enum dma_data_direction dir)
135f8c55dc6SChristoph Hellwig {
13656e35f9cSChristoph Hellwig 	if (cpu_needs_post_dma_flush())
137cbf1449bSChristoph Hellwig 		dma_sync_phys(paddr, size, dir, false);
138f8c55dc6SChristoph Hellwig }
139f263f2a2SHauke Mehrtens #endif
140f8c55dc6SChristoph Hellwig 
141347cb6afSChristoph Hellwig #ifdef CONFIG_DMA_PERDEV_COHERENT
142347cb6afSChristoph Hellwig void arch_setup_dma_ops(struct device *dev, u64 dma_base, u64 size,
143347cb6afSChristoph Hellwig 		const struct iommu_ops *iommu, bool coherent)
144347cb6afSChristoph Hellwig {
145347cb6afSChristoph Hellwig 	dev->dma_coherent = coherent;
146347cb6afSChristoph Hellwig }
147347cb6afSChristoph Hellwig #endif
148