101357a5aSChristian König // SPDX-License-Identifier: GPL-2.0-only
201357a5aSChristian König /*
301357a5aSChristian König  * dma-fence-util: misc functions for dma_fence objects
401357a5aSChristian König  *
501357a5aSChristian König  * Copyright (C) 2022 Advanced Micro Devices, Inc.
601357a5aSChristian König  * Authors:
701357a5aSChristian König  *	Christian König <christian.koenig@amd.com>
801357a5aSChristian König  */
901357a5aSChristian König 
1001357a5aSChristian König #include <linux/dma-fence.h>
1101357a5aSChristian König #include <linux/dma-fence-array.h>
1201357a5aSChristian König #include <linux/dma-fence-chain.h>
1301357a5aSChristian König #include <linux/dma-fence-unwrap.h>
14245a4a7bSChristian König #include <linux/slab.h>
1501357a5aSChristian König 
1601357a5aSChristian König /* Internal helper to start new array iteration, don't use directly */
1701357a5aSChristian König static struct dma_fence *
__dma_fence_unwrap_array(struct dma_fence_unwrap * cursor)1801357a5aSChristian König __dma_fence_unwrap_array(struct dma_fence_unwrap *cursor)
1901357a5aSChristian König {
2001357a5aSChristian König 	cursor->array = dma_fence_chain_contained(cursor->chain);
2101357a5aSChristian König 	cursor->index = 0;
2201357a5aSChristian König 	return dma_fence_array_first(cursor->array);
2301357a5aSChristian König }
2401357a5aSChristian König 
2501357a5aSChristian König /**
2601357a5aSChristian König  * dma_fence_unwrap_first - return the first fence from fence containers
2701357a5aSChristian König  * @head: the entrypoint into the containers
2801357a5aSChristian König  * @cursor: current position inside the containers
2901357a5aSChristian König  *
3001357a5aSChristian König  * Unwraps potential dma_fence_chain/dma_fence_array containers and return the
3101357a5aSChristian König  * first fence.
3201357a5aSChristian König  */
dma_fence_unwrap_first(struct dma_fence * head,struct dma_fence_unwrap * cursor)3301357a5aSChristian König struct dma_fence *dma_fence_unwrap_first(struct dma_fence *head,
3401357a5aSChristian König 					 struct dma_fence_unwrap *cursor)
3501357a5aSChristian König {
3601357a5aSChristian König 	cursor->chain = dma_fence_get(head);
3701357a5aSChristian König 	return __dma_fence_unwrap_array(cursor);
3801357a5aSChristian König }
3901357a5aSChristian König EXPORT_SYMBOL_GPL(dma_fence_unwrap_first);
4001357a5aSChristian König 
4101357a5aSChristian König /**
4201357a5aSChristian König  * dma_fence_unwrap_next - return the next fence from a fence containers
4301357a5aSChristian König  * @cursor: current position inside the containers
4401357a5aSChristian König  *
4501357a5aSChristian König  * Continue unwrapping the dma_fence_chain/dma_fence_array containers and return
4601357a5aSChristian König  * the next fence from them.
4701357a5aSChristian König  */
dma_fence_unwrap_next(struct dma_fence_unwrap * cursor)4801357a5aSChristian König struct dma_fence *dma_fence_unwrap_next(struct dma_fence_unwrap *cursor)
4901357a5aSChristian König {
5001357a5aSChristian König 	struct dma_fence *tmp;
5101357a5aSChristian König 
5201357a5aSChristian König 	++cursor->index;
5301357a5aSChristian König 	tmp = dma_fence_array_next(cursor->array, cursor->index);
5401357a5aSChristian König 	if (tmp)
5501357a5aSChristian König 		return tmp;
5601357a5aSChristian König 
5701357a5aSChristian König 	cursor->chain = dma_fence_chain_walk(cursor->chain);
5801357a5aSChristian König 	return __dma_fence_unwrap_array(cursor);
5901357a5aSChristian König }
6001357a5aSChristian König EXPORT_SYMBOL_GPL(dma_fence_unwrap_next);
61245a4a7bSChristian König 
62245a4a7bSChristian König /* Implementation for the dma_fence_merge() marco, don't use directly */
__dma_fence_unwrap_merge(unsigned int num_fences,struct dma_fence ** fences,struct dma_fence_unwrap * iter)63245a4a7bSChristian König struct dma_fence *__dma_fence_unwrap_merge(unsigned int num_fences,
64245a4a7bSChristian König 					   struct dma_fence **fences,
65245a4a7bSChristian König 					   struct dma_fence_unwrap *iter)
66245a4a7bSChristian König {
67245a4a7bSChristian König 	struct dma_fence_array *result;
68245a4a7bSChristian König 	struct dma_fence *tmp, **array;
69f781f661SChristian König 	ktime_t timestamp;
70245a4a7bSChristian König 	unsigned int i;
71245a4a7bSChristian König 	size_t count;
72245a4a7bSChristian König 
73245a4a7bSChristian König 	count = 0;
74f781f661SChristian König 	timestamp = ns_to_ktime(0);
75245a4a7bSChristian König 	for (i = 0; i < num_fences; ++i) {
76f781f661SChristian König 		dma_fence_unwrap_for_each(tmp, &iter[i], fences[i]) {
77f781f661SChristian König 			if (!dma_fence_is_signaled(tmp)) {
78245a4a7bSChristian König 				++count;
79f781f661SChristian König 			} else {
80*b83ce9cbSChristian König 				ktime_t t = dma_fence_timestamp(tmp);
81*b83ce9cbSChristian König 
82*b83ce9cbSChristian König 				if (ktime_after(t, timestamp))
83*b83ce9cbSChristian König 					timestamp = t;
84f781f661SChristian König 			}
85f781f661SChristian König 		}
86245a4a7bSChristian König 	}
87245a4a7bSChristian König 
88f781f661SChristian König 	/*
89f781f661SChristian König 	 * If we couldn't find a pending fence just return a private signaled
90f781f661SChristian König 	 * fence with the timestamp of the last signaled one.
91f781f661SChristian König 	 */
92245a4a7bSChristian König 	if (count == 0)
93f781f661SChristian König 		return dma_fence_allocate_private_stub(timestamp);
94245a4a7bSChristian König 
95245a4a7bSChristian König 	array = kmalloc_array(count, sizeof(*array), GFP_KERNEL);
96245a4a7bSChristian König 	if (!array)
97245a4a7bSChristian König 		return NULL;
98245a4a7bSChristian König 
99245a4a7bSChristian König 	/*
100245a4a7bSChristian König 	 * This trashes the input fence array and uses it as position for the
101245a4a7bSChristian König 	 * following merge loop. This works because the dma_fence_merge()
102245a4a7bSChristian König 	 * wrapper macro is creating this temporary array on the stack together
103245a4a7bSChristian König 	 * with the iterators.
104245a4a7bSChristian König 	 */
105245a4a7bSChristian König 	for (i = 0; i < num_fences; ++i)
106245a4a7bSChristian König 		fences[i] = dma_fence_unwrap_first(fences[i], &iter[i]);
107245a4a7bSChristian König 
108245a4a7bSChristian König 	count = 0;
109245a4a7bSChristian König 	do {
110245a4a7bSChristian König 		unsigned int sel;
111245a4a7bSChristian König 
112245a4a7bSChristian König restart:
113245a4a7bSChristian König 		tmp = NULL;
114245a4a7bSChristian König 		for (i = 0; i < num_fences; ++i) {
115245a4a7bSChristian König 			struct dma_fence *next;
116245a4a7bSChristian König 
117245a4a7bSChristian König 			while (fences[i] && dma_fence_is_signaled(fences[i]))
118245a4a7bSChristian König 				fences[i] = dma_fence_unwrap_next(&iter[i]);
119245a4a7bSChristian König 
120245a4a7bSChristian König 			next = fences[i];
121245a4a7bSChristian König 			if (!next)
122245a4a7bSChristian König 				continue;
123245a4a7bSChristian König 
124245a4a7bSChristian König 			/*
125245a4a7bSChristian König 			 * We can't guarantee that inpute fences are ordered by
126245a4a7bSChristian König 			 * context, but it is still quite likely when this
127245a4a7bSChristian König 			 * function is used multiple times. So attempt to order
128245a4a7bSChristian König 			 * the fences by context as we pass over them and merge
129245a4a7bSChristian König 			 * fences with the same context.
130245a4a7bSChristian König 			 */
131245a4a7bSChristian König 			if (!tmp || tmp->context > next->context) {
132245a4a7bSChristian König 				tmp = next;
133245a4a7bSChristian König 				sel = i;
134245a4a7bSChristian König 
135245a4a7bSChristian König 			} else if (tmp->context < next->context) {
136245a4a7bSChristian König 				continue;
137245a4a7bSChristian König 
138245a4a7bSChristian König 			} else if (dma_fence_is_later(tmp, next)) {
139245a4a7bSChristian König 				fences[i] = dma_fence_unwrap_next(&iter[i]);
140245a4a7bSChristian König 				goto restart;
141245a4a7bSChristian König 			} else {
142245a4a7bSChristian König 				fences[sel] = dma_fence_unwrap_next(&iter[sel]);
143245a4a7bSChristian König 				goto restart;
144245a4a7bSChristian König 			}
145245a4a7bSChristian König 		}
146245a4a7bSChristian König 
147245a4a7bSChristian König 		if (tmp) {
148245a4a7bSChristian König 			array[count++] = dma_fence_get(tmp);
149245a4a7bSChristian König 			fences[sel] = dma_fence_unwrap_next(&iter[sel]);
150245a4a7bSChristian König 		}
151245a4a7bSChristian König 	} while (tmp);
152245a4a7bSChristian König 
153245a4a7bSChristian König 	if (count == 0) {
154f781f661SChristian König 		tmp = dma_fence_allocate_private_stub(ktime_get());
155245a4a7bSChristian König 		goto return_tmp;
156245a4a7bSChristian König 	}
157245a4a7bSChristian König 
158245a4a7bSChristian König 	if (count == 1) {
159245a4a7bSChristian König 		tmp = array[0];
160245a4a7bSChristian König 		goto return_tmp;
161245a4a7bSChristian König 	}
162245a4a7bSChristian König 
163245a4a7bSChristian König 	result = dma_fence_array_create(count, array,
164245a4a7bSChristian König 					dma_fence_context_alloc(1),
165245a4a7bSChristian König 					1, false);
166245a4a7bSChristian König 	if (!result) {
167245a4a7bSChristian König 		tmp = NULL;
168245a4a7bSChristian König 		goto return_tmp;
169245a4a7bSChristian König 	}
170245a4a7bSChristian König 	return &result->base;
171245a4a7bSChristian König 
172245a4a7bSChristian König return_tmp:
173245a4a7bSChristian König 	kfree(array);
174245a4a7bSChristian König 	return tmp;
175245a4a7bSChristian König }
176245a4a7bSChristian König EXPORT_SYMBOL_GPL(__dma_fence_unwrap_merge);
177