xref: /openbmc/linux/fs/overlayfs/dir.c (revision e9be9d5e)
1e9be9d5eSMiklos Szeredi /*
2e9be9d5eSMiklos Szeredi  *
3e9be9d5eSMiklos Szeredi  * Copyright (C) 2011 Novell Inc.
4e9be9d5eSMiklos Szeredi  *
5e9be9d5eSMiklos Szeredi  * This program is free software; you can redistribute it and/or modify it
6e9be9d5eSMiklos Szeredi  * under the terms of the GNU General Public License version 2 as published by
7e9be9d5eSMiklos Szeredi  * the Free Software Foundation.
8e9be9d5eSMiklos Szeredi  */
9e9be9d5eSMiklos Szeredi 
10e9be9d5eSMiklos Szeredi #include <linux/fs.h>
11e9be9d5eSMiklos Szeredi #include <linux/namei.h>
12e9be9d5eSMiklos Szeredi #include <linux/xattr.h>
13e9be9d5eSMiklos Szeredi #include <linux/security.h>
14e9be9d5eSMiklos Szeredi #include <linux/cred.h>
15e9be9d5eSMiklos Szeredi #include "overlayfs.h"
16e9be9d5eSMiklos Szeredi 
17e9be9d5eSMiklos Szeredi void ovl_cleanup(struct inode *wdir, struct dentry *wdentry)
18e9be9d5eSMiklos Szeredi {
19e9be9d5eSMiklos Szeredi 	int err;
20e9be9d5eSMiklos Szeredi 
21e9be9d5eSMiklos Szeredi 	dget(wdentry);
22e9be9d5eSMiklos Szeredi 	if (S_ISDIR(wdentry->d_inode->i_mode))
23e9be9d5eSMiklos Szeredi 		err = ovl_do_rmdir(wdir, wdentry);
24e9be9d5eSMiklos Szeredi 	else
25e9be9d5eSMiklos Szeredi 		err = ovl_do_unlink(wdir, wdentry);
26e9be9d5eSMiklos Szeredi 	dput(wdentry);
27e9be9d5eSMiklos Szeredi 
28e9be9d5eSMiklos Szeredi 	if (err) {
29e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: cleanup of '%pd2' failed (%i)\n",
30e9be9d5eSMiklos Szeredi 		       wdentry, err);
31e9be9d5eSMiklos Szeredi 	}
32e9be9d5eSMiklos Szeredi }
33e9be9d5eSMiklos Szeredi 
34e9be9d5eSMiklos Szeredi struct dentry *ovl_lookup_temp(struct dentry *workdir, struct dentry *dentry)
35e9be9d5eSMiklos Szeredi {
36e9be9d5eSMiklos Szeredi 	struct dentry *temp;
37e9be9d5eSMiklos Szeredi 	char name[20];
38e9be9d5eSMiklos Szeredi 
39e9be9d5eSMiklos Szeredi 	snprintf(name, sizeof(name), "#%lx", (unsigned long) dentry);
40e9be9d5eSMiklos Szeredi 
41e9be9d5eSMiklos Szeredi 	temp = lookup_one_len(name, workdir, strlen(name));
42e9be9d5eSMiklos Szeredi 	if (!IS_ERR(temp) && temp->d_inode) {
43e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: workdir/%s already exists\n", name);
44e9be9d5eSMiklos Szeredi 		dput(temp);
45e9be9d5eSMiklos Szeredi 		temp = ERR_PTR(-EIO);
46e9be9d5eSMiklos Szeredi 	}
47e9be9d5eSMiklos Szeredi 
48e9be9d5eSMiklos Szeredi 	return temp;
49e9be9d5eSMiklos Szeredi }
50e9be9d5eSMiklos Szeredi 
51e9be9d5eSMiklos Szeredi /* caller holds i_mutex on workdir */
52e9be9d5eSMiklos Szeredi static struct dentry *ovl_whiteout(struct dentry *workdir,
53e9be9d5eSMiklos Szeredi 				   struct dentry *dentry)
54e9be9d5eSMiklos Szeredi {
55e9be9d5eSMiklos Szeredi 	int err;
56e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
57e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
58e9be9d5eSMiklos Szeredi 
59e9be9d5eSMiklos Szeredi 	whiteout = ovl_lookup_temp(workdir, dentry);
60e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
61e9be9d5eSMiklos Szeredi 		return whiteout;
62e9be9d5eSMiklos Szeredi 
63e9be9d5eSMiklos Szeredi 	err = ovl_do_whiteout(wdir, whiteout);
64e9be9d5eSMiklos Szeredi 	if (err) {
65e9be9d5eSMiklos Szeredi 		dput(whiteout);
66e9be9d5eSMiklos Szeredi 		whiteout = ERR_PTR(err);
67e9be9d5eSMiklos Szeredi 	}
68e9be9d5eSMiklos Szeredi 
69e9be9d5eSMiklos Szeredi 	return whiteout;
70e9be9d5eSMiklos Szeredi }
71e9be9d5eSMiklos Szeredi 
72e9be9d5eSMiklos Szeredi int ovl_create_real(struct inode *dir, struct dentry *newdentry,
73e9be9d5eSMiklos Szeredi 		    struct kstat *stat, const char *link,
74e9be9d5eSMiklos Szeredi 		    struct dentry *hardlink, bool debug)
75e9be9d5eSMiklos Szeredi {
76e9be9d5eSMiklos Szeredi 	int err;
77e9be9d5eSMiklos Szeredi 
78e9be9d5eSMiklos Szeredi 	if (newdentry->d_inode)
79e9be9d5eSMiklos Szeredi 		return -ESTALE;
80e9be9d5eSMiklos Szeredi 
81e9be9d5eSMiklos Szeredi 	if (hardlink) {
82e9be9d5eSMiklos Szeredi 		err = ovl_do_link(hardlink, dir, newdentry, debug);
83e9be9d5eSMiklos Szeredi 	} else {
84e9be9d5eSMiklos Szeredi 		switch (stat->mode & S_IFMT) {
85e9be9d5eSMiklos Szeredi 		case S_IFREG:
86e9be9d5eSMiklos Szeredi 			err = ovl_do_create(dir, newdentry, stat->mode, debug);
87e9be9d5eSMiklos Szeredi 			break;
88e9be9d5eSMiklos Szeredi 
89e9be9d5eSMiklos Szeredi 		case S_IFDIR:
90e9be9d5eSMiklos Szeredi 			err = ovl_do_mkdir(dir, newdentry, stat->mode, debug);
91e9be9d5eSMiklos Szeredi 			break;
92e9be9d5eSMiklos Szeredi 
93e9be9d5eSMiklos Szeredi 		case S_IFCHR:
94e9be9d5eSMiklos Szeredi 		case S_IFBLK:
95e9be9d5eSMiklos Szeredi 		case S_IFIFO:
96e9be9d5eSMiklos Szeredi 		case S_IFSOCK:
97e9be9d5eSMiklos Szeredi 			err = ovl_do_mknod(dir, newdentry,
98e9be9d5eSMiklos Szeredi 					   stat->mode, stat->rdev, debug);
99e9be9d5eSMiklos Szeredi 			break;
100e9be9d5eSMiklos Szeredi 
101e9be9d5eSMiklos Szeredi 		case S_IFLNK:
102e9be9d5eSMiklos Szeredi 			err = ovl_do_symlink(dir, newdentry, link, debug);
103e9be9d5eSMiklos Szeredi 			break;
104e9be9d5eSMiklos Szeredi 
105e9be9d5eSMiklos Szeredi 		default:
106e9be9d5eSMiklos Szeredi 			err = -EPERM;
107e9be9d5eSMiklos Szeredi 		}
108e9be9d5eSMiklos Szeredi 	}
109e9be9d5eSMiklos Szeredi 	if (!err && WARN_ON(!newdentry->d_inode)) {
110e9be9d5eSMiklos Szeredi 		/*
111e9be9d5eSMiklos Szeredi 		 * Not quite sure if non-instantiated dentry is legal or not.
112e9be9d5eSMiklos Szeredi 		 * VFS doesn't seem to care so check and warn here.
113e9be9d5eSMiklos Szeredi 		 */
114e9be9d5eSMiklos Szeredi 		err = -ENOENT;
115e9be9d5eSMiklos Szeredi 	}
116e9be9d5eSMiklos Szeredi 	return err;
117e9be9d5eSMiklos Szeredi }
118e9be9d5eSMiklos Szeredi 
119e9be9d5eSMiklos Szeredi static int ovl_set_opaque(struct dentry *upperdentry)
120e9be9d5eSMiklos Szeredi {
121e9be9d5eSMiklos Szeredi 	return ovl_do_setxattr(upperdentry, ovl_opaque_xattr, "y", 1, 0);
122e9be9d5eSMiklos Szeredi }
123e9be9d5eSMiklos Szeredi 
124e9be9d5eSMiklos Szeredi static void ovl_remove_opaque(struct dentry *upperdentry)
125e9be9d5eSMiklos Szeredi {
126e9be9d5eSMiklos Szeredi 	int err;
127e9be9d5eSMiklos Szeredi 
128e9be9d5eSMiklos Szeredi 	err = ovl_do_removexattr(upperdentry, ovl_opaque_xattr);
129e9be9d5eSMiklos Szeredi 	if (err) {
130e9be9d5eSMiklos Szeredi 		pr_warn("overlayfs: failed to remove opaque from '%s' (%i)\n",
131e9be9d5eSMiklos Szeredi 			upperdentry->d_name.name, err);
132e9be9d5eSMiklos Szeredi 	}
133e9be9d5eSMiklos Szeredi }
134e9be9d5eSMiklos Szeredi 
135e9be9d5eSMiklos Szeredi static int ovl_dir_getattr(struct vfsmount *mnt, struct dentry *dentry,
136e9be9d5eSMiklos Szeredi 			 struct kstat *stat)
137e9be9d5eSMiklos Szeredi {
138e9be9d5eSMiklos Szeredi 	int err;
139e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
140e9be9d5eSMiklos Szeredi 	struct path realpath;
141e9be9d5eSMiklos Szeredi 
142e9be9d5eSMiklos Szeredi 	type = ovl_path_real(dentry, &realpath);
143e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&realpath, stat);
144e9be9d5eSMiklos Szeredi 	if (err)
145e9be9d5eSMiklos Szeredi 		return err;
146e9be9d5eSMiklos Szeredi 
147e9be9d5eSMiklos Szeredi 	stat->dev = dentry->d_sb->s_dev;
148e9be9d5eSMiklos Szeredi 	stat->ino = dentry->d_inode->i_ino;
149e9be9d5eSMiklos Szeredi 
150e9be9d5eSMiklos Szeredi 	/*
151e9be9d5eSMiklos Szeredi 	 * It's probably not worth it to count subdirs to get the
152e9be9d5eSMiklos Szeredi 	 * correct link count.  nlink=1 seems to pacify 'find' and
153e9be9d5eSMiklos Szeredi 	 * other utilities.
154e9be9d5eSMiklos Szeredi 	 */
155e9be9d5eSMiklos Szeredi 	if (type == OVL_PATH_MERGE)
156e9be9d5eSMiklos Szeredi 		stat->nlink = 1;
157e9be9d5eSMiklos Szeredi 
158e9be9d5eSMiklos Szeredi 	return 0;
159e9be9d5eSMiklos Szeredi }
160e9be9d5eSMiklos Szeredi 
161e9be9d5eSMiklos Szeredi static int ovl_create_upper(struct dentry *dentry, struct inode *inode,
162e9be9d5eSMiklos Szeredi 			    struct kstat *stat, const char *link,
163e9be9d5eSMiklos Szeredi 			    struct dentry *hardlink)
164e9be9d5eSMiklos Szeredi {
165e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
166e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
167e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
168e9be9d5eSMiklos Szeredi 	int err;
169e9be9d5eSMiklos Szeredi 
170e9be9d5eSMiklos Szeredi 	mutex_lock_nested(&udir->i_mutex, I_MUTEX_PARENT);
171e9be9d5eSMiklos Szeredi 	newdentry = lookup_one_len(dentry->d_name.name, upperdir,
172e9be9d5eSMiklos Szeredi 				   dentry->d_name.len);
173e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
174e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
175e9be9d5eSMiklos Szeredi 		goto out_unlock;
176e9be9d5eSMiklos Szeredi 	err = ovl_create_real(udir, newdentry, stat, link, hardlink, false);
177e9be9d5eSMiklos Szeredi 	if (err)
178e9be9d5eSMiklos Szeredi 		goto out_dput;
179e9be9d5eSMiklos Szeredi 
180e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
181e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
182e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
183e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
184e9be9d5eSMiklos Szeredi 	newdentry = NULL;
185e9be9d5eSMiklos Szeredi out_dput:
186e9be9d5eSMiklos Szeredi 	dput(newdentry);
187e9be9d5eSMiklos Szeredi out_unlock:
188e9be9d5eSMiklos Szeredi 	mutex_unlock(&udir->i_mutex);
189e9be9d5eSMiklos Szeredi 	return err;
190e9be9d5eSMiklos Szeredi }
191e9be9d5eSMiklos Szeredi 
192e9be9d5eSMiklos Szeredi static int ovl_lock_rename_workdir(struct dentry *workdir,
193e9be9d5eSMiklos Szeredi 				   struct dentry *upperdir)
194e9be9d5eSMiklos Szeredi {
195e9be9d5eSMiklos Szeredi 	/* Workdir should not be the same as upperdir */
196e9be9d5eSMiklos Szeredi 	if (workdir == upperdir)
197e9be9d5eSMiklos Szeredi 		goto err;
198e9be9d5eSMiklos Szeredi 
199e9be9d5eSMiklos Szeredi 	/* Workdir should not be subdir of upperdir and vice versa */
200e9be9d5eSMiklos Szeredi 	if (lock_rename(workdir, upperdir) != NULL)
201e9be9d5eSMiklos Szeredi 		goto err_unlock;
202e9be9d5eSMiklos Szeredi 
203e9be9d5eSMiklos Szeredi 	return 0;
204e9be9d5eSMiklos Szeredi 
205e9be9d5eSMiklos Szeredi err_unlock:
206e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
207e9be9d5eSMiklos Szeredi err:
208e9be9d5eSMiklos Szeredi 	pr_err("overlayfs: failed to lock workdir+upperdir\n");
209e9be9d5eSMiklos Szeredi 	return -EIO;
210e9be9d5eSMiklos Szeredi }
211e9be9d5eSMiklos Szeredi 
212e9be9d5eSMiklos Szeredi static struct dentry *ovl_clear_empty(struct dentry *dentry,
213e9be9d5eSMiklos Szeredi 				      struct list_head *list)
214e9be9d5eSMiklos Szeredi {
215e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
216e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
217e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
218e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
219e9be9d5eSMiklos Szeredi 	struct path upperpath;
220e9be9d5eSMiklos Szeredi 	struct dentry *upper;
221e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir;
222e9be9d5eSMiklos Szeredi 	struct kstat stat;
223e9be9d5eSMiklos Szeredi 	int err;
224e9be9d5eSMiklos Szeredi 
225e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
226e9be9d5eSMiklos Szeredi 	if (err)
227e9be9d5eSMiklos Szeredi 		goto out;
228e9be9d5eSMiklos Szeredi 
229e9be9d5eSMiklos Szeredi 	ovl_path_upper(dentry, &upperpath);
230e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&upperpath, &stat);
231e9be9d5eSMiklos Szeredi 	if (err)
232e9be9d5eSMiklos Szeredi 		goto out_unlock;
233e9be9d5eSMiklos Szeredi 
234e9be9d5eSMiklos Szeredi 	err = -ESTALE;
235e9be9d5eSMiklos Szeredi 	if (!S_ISDIR(stat.mode))
236e9be9d5eSMiklos Szeredi 		goto out_unlock;
237e9be9d5eSMiklos Szeredi 	upper = upperpath.dentry;
238e9be9d5eSMiklos Szeredi 	if (upper->d_parent->d_inode != udir)
239e9be9d5eSMiklos Szeredi 		goto out_unlock;
240e9be9d5eSMiklos Szeredi 
241e9be9d5eSMiklos Szeredi 	opaquedir = ovl_lookup_temp(workdir, dentry);
242e9be9d5eSMiklos Szeredi 	err = PTR_ERR(opaquedir);
243e9be9d5eSMiklos Szeredi 	if (IS_ERR(opaquedir))
244e9be9d5eSMiklos Szeredi 		goto out_unlock;
245e9be9d5eSMiklos Szeredi 
246e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, opaquedir, &stat, NULL, NULL, true);
247e9be9d5eSMiklos Szeredi 	if (err)
248e9be9d5eSMiklos Szeredi 		goto out_dput;
249e9be9d5eSMiklos Szeredi 
250e9be9d5eSMiklos Szeredi 	err = ovl_copy_xattr(upper, opaquedir);
251e9be9d5eSMiklos Szeredi 	if (err)
252e9be9d5eSMiklos Szeredi 		goto out_cleanup;
253e9be9d5eSMiklos Szeredi 
254e9be9d5eSMiklos Szeredi 	err = ovl_set_opaque(opaquedir);
255e9be9d5eSMiklos Szeredi 	if (err)
256e9be9d5eSMiklos Szeredi 		goto out_cleanup;
257e9be9d5eSMiklos Szeredi 
258e9be9d5eSMiklos Szeredi 	mutex_lock(&opaquedir->d_inode->i_mutex);
259e9be9d5eSMiklos Szeredi 	err = ovl_set_attr(opaquedir, &stat);
260e9be9d5eSMiklos Szeredi 	mutex_unlock(&opaquedir->d_inode->i_mutex);
261e9be9d5eSMiklos Szeredi 	if (err)
262e9be9d5eSMiklos Szeredi 		goto out_cleanup;
263e9be9d5eSMiklos Szeredi 
264e9be9d5eSMiklos Szeredi 	err = ovl_do_rename(wdir, opaquedir, udir, upper, RENAME_EXCHANGE);
265e9be9d5eSMiklos Szeredi 	if (err)
266e9be9d5eSMiklos Szeredi 		goto out_cleanup;
267e9be9d5eSMiklos Szeredi 
268e9be9d5eSMiklos Szeredi 	ovl_cleanup_whiteouts(upper, list);
269e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, upper);
270e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
271e9be9d5eSMiklos Szeredi 
272e9be9d5eSMiklos Szeredi 	/* dentry's upper doesn't match now, get rid of it */
273e9be9d5eSMiklos Szeredi 	d_drop(dentry);
274e9be9d5eSMiklos Szeredi 
275e9be9d5eSMiklos Szeredi 	return opaquedir;
276e9be9d5eSMiklos Szeredi 
277e9be9d5eSMiklos Szeredi out_cleanup:
278e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, opaquedir);
279e9be9d5eSMiklos Szeredi out_dput:
280e9be9d5eSMiklos Szeredi 	dput(opaquedir);
281e9be9d5eSMiklos Szeredi out_unlock:
282e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
283e9be9d5eSMiklos Szeredi out:
284e9be9d5eSMiklos Szeredi 	return ERR_PTR(err);
285e9be9d5eSMiklos Szeredi }
286e9be9d5eSMiklos Szeredi 
287e9be9d5eSMiklos Szeredi static struct dentry *ovl_check_empty_and_clear(struct dentry *dentry,
288e9be9d5eSMiklos Szeredi 						enum ovl_path_type type)
289e9be9d5eSMiklos Szeredi {
290e9be9d5eSMiklos Szeredi 	int err;
291e9be9d5eSMiklos Szeredi 	struct dentry *ret = NULL;
292e9be9d5eSMiklos Szeredi 	LIST_HEAD(list);
293e9be9d5eSMiklos Szeredi 
294e9be9d5eSMiklos Szeredi 	err = ovl_check_empty_dir(dentry, &list);
295e9be9d5eSMiklos Szeredi 	if (err)
296e9be9d5eSMiklos Szeredi 		ret = ERR_PTR(err);
297e9be9d5eSMiklos Szeredi 	else if (type == OVL_PATH_MERGE)
298e9be9d5eSMiklos Szeredi 		ret = ovl_clear_empty(dentry, &list);
299e9be9d5eSMiklos Szeredi 
300e9be9d5eSMiklos Szeredi 	ovl_cache_free(&list);
301e9be9d5eSMiklos Szeredi 
302e9be9d5eSMiklos Szeredi 	return ret;
303e9be9d5eSMiklos Szeredi }
304e9be9d5eSMiklos Szeredi 
305e9be9d5eSMiklos Szeredi static int ovl_create_over_whiteout(struct dentry *dentry, struct inode *inode,
306e9be9d5eSMiklos Szeredi 				    struct kstat *stat, const char *link,
307e9be9d5eSMiklos Szeredi 				    struct dentry *hardlink)
308e9be9d5eSMiklos Szeredi {
309e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
310e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
311e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
312e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
313e9be9d5eSMiklos Szeredi 	struct dentry *upper;
314e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
315e9be9d5eSMiklos Szeredi 	int err;
316e9be9d5eSMiklos Szeredi 
317e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
318e9be9d5eSMiklos Szeredi 	if (err)
319e9be9d5eSMiklos Szeredi 		goto out;
320e9be9d5eSMiklos Szeredi 
321e9be9d5eSMiklos Szeredi 	newdentry = ovl_lookup_temp(workdir, dentry);
322e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
323e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
324e9be9d5eSMiklos Szeredi 		goto out_unlock;
325e9be9d5eSMiklos Szeredi 
326e9be9d5eSMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
327e9be9d5eSMiklos Szeredi 			       dentry->d_name.len);
328e9be9d5eSMiklos Szeredi 	err = PTR_ERR(upper);
329e9be9d5eSMiklos Szeredi 	if (IS_ERR(upper))
330e9be9d5eSMiklos Szeredi 		goto out_dput;
331e9be9d5eSMiklos Szeredi 
332e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, newdentry, stat, link, hardlink, true);
333e9be9d5eSMiklos Szeredi 	if (err)
334e9be9d5eSMiklos Szeredi 		goto out_dput2;
335e9be9d5eSMiklos Szeredi 
336e9be9d5eSMiklos Szeredi 	if (S_ISDIR(stat->mode)) {
337e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
338e9be9d5eSMiklos Szeredi 		if (err)
339e9be9d5eSMiklos Szeredi 			goto out_cleanup;
340e9be9d5eSMiklos Szeredi 
341e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper,
342e9be9d5eSMiklos Szeredi 				    RENAME_EXCHANGE);
343e9be9d5eSMiklos Szeredi 		if (err)
344e9be9d5eSMiklos Szeredi 			goto out_cleanup;
345e9be9d5eSMiklos Szeredi 
346e9be9d5eSMiklos Szeredi 		ovl_cleanup(wdir, upper);
347e9be9d5eSMiklos Szeredi 	} else {
348e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper, 0);
349e9be9d5eSMiklos Szeredi 		if (err)
350e9be9d5eSMiklos Szeredi 			goto out_cleanup;
351e9be9d5eSMiklos Szeredi 	}
352e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
353e9be9d5eSMiklos Szeredi 	ovl_dentry_update(dentry, newdentry);
354e9be9d5eSMiklos Szeredi 	ovl_copyattr(newdentry->d_inode, inode);
355e9be9d5eSMiklos Szeredi 	d_instantiate(dentry, inode);
356e9be9d5eSMiklos Szeredi 	newdentry = NULL;
357e9be9d5eSMiklos Szeredi out_dput2:
358e9be9d5eSMiklos Szeredi 	dput(upper);
359e9be9d5eSMiklos Szeredi out_dput:
360e9be9d5eSMiklos Szeredi 	dput(newdentry);
361e9be9d5eSMiklos Szeredi out_unlock:
362e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
363e9be9d5eSMiklos Szeredi out:
364e9be9d5eSMiklos Szeredi 	return err;
365e9be9d5eSMiklos Szeredi 
366e9be9d5eSMiklos Szeredi out_cleanup:
367e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, newdentry);
368e9be9d5eSMiklos Szeredi 	goto out_dput2;
369e9be9d5eSMiklos Szeredi }
370e9be9d5eSMiklos Szeredi 
371e9be9d5eSMiklos Szeredi static int ovl_create_or_link(struct dentry *dentry, int mode, dev_t rdev,
372e9be9d5eSMiklos Szeredi 			      const char *link, struct dentry *hardlink)
373e9be9d5eSMiklos Szeredi {
374e9be9d5eSMiklos Szeredi 	int err;
375e9be9d5eSMiklos Szeredi 	struct inode *inode;
376e9be9d5eSMiklos Szeredi 	struct kstat stat = {
377e9be9d5eSMiklos Szeredi 		.mode = mode,
378e9be9d5eSMiklos Szeredi 		.rdev = rdev,
379e9be9d5eSMiklos Szeredi 	};
380e9be9d5eSMiklos Szeredi 
381e9be9d5eSMiklos Szeredi 	err = -ENOMEM;
382e9be9d5eSMiklos Szeredi 	inode = ovl_new_inode(dentry->d_sb, mode, dentry->d_fsdata);
383e9be9d5eSMiklos Szeredi 	if (!inode)
384e9be9d5eSMiklos Szeredi 		goto out;
385e9be9d5eSMiklos Szeredi 
386e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
387e9be9d5eSMiklos Szeredi 	if (err)
388e9be9d5eSMiklos Szeredi 		goto out_iput;
389e9be9d5eSMiklos Szeredi 
390e9be9d5eSMiklos Szeredi 	if (!ovl_dentry_is_opaque(dentry)) {
391e9be9d5eSMiklos Szeredi 		err = ovl_create_upper(dentry, inode, &stat, link, hardlink);
392e9be9d5eSMiklos Szeredi 	} else {
393e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
394e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
395e9be9d5eSMiklos Szeredi 
396e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
397e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
398e9be9d5eSMiklos Szeredi 		if (!override_cred)
399e9be9d5eSMiklos Szeredi 			goto out_iput;
400e9be9d5eSMiklos Szeredi 
401e9be9d5eSMiklos Szeredi 		/*
402e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting opaque xattr
403e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
404e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
405e9be9d5eSMiklos Szeredi 		 */
406e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
407e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
408e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
409e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
410e9be9d5eSMiklos Szeredi 
411e9be9d5eSMiklos Szeredi 		err = ovl_create_over_whiteout(dentry, inode, &stat, link,
412e9be9d5eSMiklos Szeredi 					       hardlink);
413e9be9d5eSMiklos Szeredi 
414e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
415e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
416e9be9d5eSMiklos Szeredi 	}
417e9be9d5eSMiklos Szeredi 
418e9be9d5eSMiklos Szeredi 	if (!err)
419e9be9d5eSMiklos Szeredi 		inode = NULL;
420e9be9d5eSMiklos Szeredi out_iput:
421e9be9d5eSMiklos Szeredi 	iput(inode);
422e9be9d5eSMiklos Szeredi out:
423e9be9d5eSMiklos Szeredi 	return err;
424e9be9d5eSMiklos Szeredi }
425e9be9d5eSMiklos Szeredi 
426e9be9d5eSMiklos Szeredi static int ovl_create_object(struct dentry *dentry, int mode, dev_t rdev,
427e9be9d5eSMiklos Szeredi 			     const char *link)
428e9be9d5eSMiklos Szeredi {
429e9be9d5eSMiklos Szeredi 	int err;
430e9be9d5eSMiklos Szeredi 
431e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
432e9be9d5eSMiklos Szeredi 	if (!err) {
433e9be9d5eSMiklos Szeredi 		err = ovl_create_or_link(dentry, mode, rdev, link, NULL);
434e9be9d5eSMiklos Szeredi 		ovl_drop_write(dentry);
435e9be9d5eSMiklos Szeredi 	}
436e9be9d5eSMiklos Szeredi 
437e9be9d5eSMiklos Szeredi 	return err;
438e9be9d5eSMiklos Szeredi }
439e9be9d5eSMiklos Szeredi 
440e9be9d5eSMiklos Szeredi static int ovl_create(struct inode *dir, struct dentry *dentry, umode_t mode,
441e9be9d5eSMiklos Szeredi 		      bool excl)
442e9be9d5eSMiklos Szeredi {
443e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFREG, 0, NULL);
444e9be9d5eSMiklos Szeredi }
445e9be9d5eSMiklos Szeredi 
446e9be9d5eSMiklos Szeredi static int ovl_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode)
447e9be9d5eSMiklos Szeredi {
448e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFDIR, 0, NULL);
449e9be9d5eSMiklos Szeredi }
450e9be9d5eSMiklos Szeredi 
451e9be9d5eSMiklos Szeredi static int ovl_mknod(struct inode *dir, struct dentry *dentry, umode_t mode,
452e9be9d5eSMiklos Szeredi 		     dev_t rdev)
453e9be9d5eSMiklos Szeredi {
454e9be9d5eSMiklos Szeredi 	/* Don't allow creation of "whiteout" on overlay */
455e9be9d5eSMiklos Szeredi 	if (S_ISCHR(mode) && rdev == WHITEOUT_DEV)
456e9be9d5eSMiklos Szeredi 		return -EPERM;
457e9be9d5eSMiklos Szeredi 
458e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, mode, rdev, NULL);
459e9be9d5eSMiklos Szeredi }
460e9be9d5eSMiklos Szeredi 
461e9be9d5eSMiklos Szeredi static int ovl_symlink(struct inode *dir, struct dentry *dentry,
462e9be9d5eSMiklos Szeredi 		       const char *link)
463e9be9d5eSMiklos Szeredi {
464e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, S_IFLNK, 0, link);
465e9be9d5eSMiklos Szeredi }
466e9be9d5eSMiklos Szeredi 
467e9be9d5eSMiklos Szeredi static int ovl_link(struct dentry *old, struct inode *newdir,
468e9be9d5eSMiklos Szeredi 		    struct dentry *new)
469e9be9d5eSMiklos Szeredi {
470e9be9d5eSMiklos Szeredi 	int err;
471e9be9d5eSMiklos Szeredi 	struct dentry *upper;
472e9be9d5eSMiklos Szeredi 
473e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
474e9be9d5eSMiklos Szeredi 	if (err)
475e9be9d5eSMiklos Szeredi 		goto out;
476e9be9d5eSMiklos Szeredi 
477e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
478e9be9d5eSMiklos Szeredi 	if (err)
479e9be9d5eSMiklos Szeredi 		goto out_drop_write;
480e9be9d5eSMiklos Szeredi 
481e9be9d5eSMiklos Szeredi 	upper = ovl_dentry_upper(old);
482e9be9d5eSMiklos Szeredi 	err = ovl_create_or_link(new, upper->d_inode->i_mode, 0, NULL, upper);
483e9be9d5eSMiklos Szeredi 
484e9be9d5eSMiklos Szeredi out_drop_write:
485e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
486e9be9d5eSMiklos Szeredi out:
487e9be9d5eSMiklos Szeredi 	return err;
488e9be9d5eSMiklos Szeredi }
489e9be9d5eSMiklos Szeredi 
490e9be9d5eSMiklos Szeredi static int ovl_remove_and_whiteout(struct dentry *dentry,
491e9be9d5eSMiklos Szeredi 				   enum ovl_path_type type, bool is_dir)
492e9be9d5eSMiklos Szeredi {
493e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
494e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
495e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
496e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
497e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
498e9be9d5eSMiklos Szeredi 	struct dentry *upper;
499e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
500e9be9d5eSMiklos Szeredi 	int err;
501e9be9d5eSMiklos Szeredi 
502e9be9d5eSMiklos Szeredi 	if (is_dir) {
503e9be9d5eSMiklos Szeredi 		opaquedir = ovl_check_empty_and_clear(dentry, type);
504e9be9d5eSMiklos Szeredi 		err = PTR_ERR(opaquedir);
505e9be9d5eSMiklos Szeredi 		if (IS_ERR(opaquedir))
506e9be9d5eSMiklos Szeredi 			goto out;
507e9be9d5eSMiklos Szeredi 	}
508e9be9d5eSMiklos Szeredi 
509e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
510e9be9d5eSMiklos Szeredi 	if (err)
511e9be9d5eSMiklos Szeredi 		goto out_dput;
512e9be9d5eSMiklos Szeredi 
513e9be9d5eSMiklos Szeredi 	whiteout = ovl_whiteout(workdir, dentry);
514e9be9d5eSMiklos Szeredi 	err = PTR_ERR(whiteout);
515e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
516e9be9d5eSMiklos Szeredi 		goto out_unlock;
517e9be9d5eSMiklos Szeredi 
518e9be9d5eSMiklos Szeredi 	if (type == OVL_PATH_LOWER) {
519e9be9d5eSMiklos Szeredi 		upper = lookup_one_len(dentry->d_name.name, upperdir,
520e9be9d5eSMiklos Szeredi 					   dentry->d_name.len);
521e9be9d5eSMiklos Szeredi 		err = PTR_ERR(upper);
522e9be9d5eSMiklos Szeredi 		if (IS_ERR(upper))
523e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
524e9be9d5eSMiklos Szeredi 
525e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, 0);
526e9be9d5eSMiklos Szeredi 		dput(upper);
527e9be9d5eSMiklos Szeredi 		if (err)
528e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
529e9be9d5eSMiklos Szeredi 	} else {
530e9be9d5eSMiklos Szeredi 		int flags = 0;
531e9be9d5eSMiklos Szeredi 
532e9be9d5eSMiklos Szeredi 		upper = ovl_dentry_upper(dentry);
533e9be9d5eSMiklos Szeredi 		if (opaquedir)
534e9be9d5eSMiklos Szeredi 			upper = opaquedir;
535e9be9d5eSMiklos Szeredi 		err = -ESTALE;
536e9be9d5eSMiklos Szeredi 		if (upper->d_parent != upperdir)
537e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
538e9be9d5eSMiklos Szeredi 
539e9be9d5eSMiklos Szeredi 		if (is_dir)
540e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
541e9be9d5eSMiklos Szeredi 
542e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, whiteout, udir, upper, flags);
543e9be9d5eSMiklos Szeredi 		if (err)
544e9be9d5eSMiklos Szeredi 			goto kill_whiteout;
545e9be9d5eSMiklos Szeredi 
546e9be9d5eSMiklos Szeredi 		if (is_dir)
547e9be9d5eSMiklos Szeredi 			ovl_cleanup(wdir, upper);
548e9be9d5eSMiklos Szeredi 	}
549e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
550e9be9d5eSMiklos Szeredi out_d_drop:
551e9be9d5eSMiklos Szeredi 	d_drop(dentry);
552e9be9d5eSMiklos Szeredi 	dput(whiteout);
553e9be9d5eSMiklos Szeredi out_unlock:
554e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
555e9be9d5eSMiklos Szeredi out_dput:
556e9be9d5eSMiklos Szeredi 	dput(opaquedir);
557e9be9d5eSMiklos Szeredi out:
558e9be9d5eSMiklos Szeredi 	return err;
559e9be9d5eSMiklos Szeredi 
560e9be9d5eSMiklos Szeredi kill_whiteout:
561e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, whiteout);
562e9be9d5eSMiklos Szeredi 	goto out_d_drop;
563e9be9d5eSMiklos Szeredi }
564e9be9d5eSMiklos Szeredi 
565e9be9d5eSMiklos Szeredi static int ovl_remove_upper(struct dentry *dentry, bool is_dir)
566e9be9d5eSMiklos Szeredi {
567e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
568e9be9d5eSMiklos Szeredi 	struct inode *dir = upperdir->d_inode;
569e9be9d5eSMiklos Szeredi 	struct dentry *upper = ovl_dentry_upper(dentry);
570e9be9d5eSMiklos Szeredi 	int err;
571e9be9d5eSMiklos Szeredi 
572e9be9d5eSMiklos Szeredi 	mutex_lock_nested(&dir->i_mutex, I_MUTEX_PARENT);
573e9be9d5eSMiklos Szeredi 	err = -ESTALE;
574e9be9d5eSMiklos Szeredi 	if (upper->d_parent == upperdir) {
575e9be9d5eSMiklos Szeredi 		/* Don't let d_delete() think it can reset d_inode */
576e9be9d5eSMiklos Szeredi 		dget(upper);
577e9be9d5eSMiklos Szeredi 		if (is_dir)
578e9be9d5eSMiklos Szeredi 			err = vfs_rmdir(dir, upper);
579e9be9d5eSMiklos Szeredi 		else
580e9be9d5eSMiklos Szeredi 			err = vfs_unlink(dir, upper, NULL);
581e9be9d5eSMiklos Szeredi 		dput(upper);
582e9be9d5eSMiklos Szeredi 		ovl_dentry_version_inc(dentry->d_parent);
583e9be9d5eSMiklos Szeredi 	}
584e9be9d5eSMiklos Szeredi 
585e9be9d5eSMiklos Szeredi 	/*
586e9be9d5eSMiklos Szeredi 	 * Keeping this dentry hashed would mean having to release
587e9be9d5eSMiklos Szeredi 	 * upperpath/lowerpath, which could only be done if we are the
588e9be9d5eSMiklos Szeredi 	 * sole user of this dentry.  Too tricky...  Just unhash for
589e9be9d5eSMiklos Szeredi 	 * now.
590e9be9d5eSMiklos Szeredi 	 */
591e9be9d5eSMiklos Szeredi 	d_drop(dentry);
592e9be9d5eSMiklos Szeredi 	mutex_unlock(&dir->i_mutex);
593e9be9d5eSMiklos Szeredi 
594e9be9d5eSMiklos Szeredi 	return err;
595e9be9d5eSMiklos Szeredi }
596e9be9d5eSMiklos Szeredi 
597e9be9d5eSMiklos Szeredi static inline int ovl_check_sticky(struct dentry *dentry)
598e9be9d5eSMiklos Szeredi {
599e9be9d5eSMiklos Szeredi 	struct inode *dir = ovl_dentry_real(dentry->d_parent)->d_inode;
600e9be9d5eSMiklos Szeredi 	struct inode *inode = ovl_dentry_real(dentry)->d_inode;
601e9be9d5eSMiklos Szeredi 
602e9be9d5eSMiklos Szeredi 	if (check_sticky(dir, inode))
603e9be9d5eSMiklos Szeredi 		return -EPERM;
604e9be9d5eSMiklos Szeredi 
605e9be9d5eSMiklos Szeredi 	return 0;
606e9be9d5eSMiklos Szeredi }
607e9be9d5eSMiklos Szeredi 
608e9be9d5eSMiklos Szeredi static int ovl_do_remove(struct dentry *dentry, bool is_dir)
609e9be9d5eSMiklos Szeredi {
610e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
611e9be9d5eSMiklos Szeredi 	int err;
612e9be9d5eSMiklos Szeredi 
613e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(dentry);
614e9be9d5eSMiklos Szeredi 	if (err)
615e9be9d5eSMiklos Szeredi 		goto out;
616e9be9d5eSMiklos Szeredi 
617e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
618e9be9d5eSMiklos Szeredi 	if (err)
619e9be9d5eSMiklos Szeredi 		goto out;
620e9be9d5eSMiklos Szeredi 
621e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
622e9be9d5eSMiklos Szeredi 	if (err)
623e9be9d5eSMiklos Szeredi 		goto out_drop_write;
624e9be9d5eSMiklos Szeredi 
625e9be9d5eSMiklos Szeredi 	type = ovl_path_type(dentry);
626e9be9d5eSMiklos Szeredi 	if (type == OVL_PATH_PURE_UPPER) {
627e9be9d5eSMiklos Szeredi 		err = ovl_remove_upper(dentry, is_dir);
628e9be9d5eSMiklos Szeredi 	} else {
629e9be9d5eSMiklos Szeredi 		const struct cred *old_cred;
630e9be9d5eSMiklos Szeredi 		struct cred *override_cred;
631e9be9d5eSMiklos Szeredi 
632e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
633e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
634e9be9d5eSMiklos Szeredi 		if (!override_cred)
635e9be9d5eSMiklos Szeredi 			goto out_drop_write;
636e9be9d5eSMiklos Szeredi 
637e9be9d5eSMiklos Szeredi 		/*
638e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
639e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir, rename
640e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
641e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
642e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
643e9be9d5eSMiklos Szeredi 		 */
644e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
645e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
646e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
647e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
648e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
649e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
650e9be9d5eSMiklos Szeredi 
651e9be9d5eSMiklos Szeredi 		err = ovl_remove_and_whiteout(dentry, type, is_dir);
652e9be9d5eSMiklos Szeredi 
653e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
654e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
655e9be9d5eSMiklos Szeredi 	}
656e9be9d5eSMiklos Szeredi out_drop_write:
657e9be9d5eSMiklos Szeredi 	ovl_drop_write(dentry);
658e9be9d5eSMiklos Szeredi out:
659e9be9d5eSMiklos Szeredi 	return err;
660e9be9d5eSMiklos Szeredi }
661e9be9d5eSMiklos Szeredi 
662e9be9d5eSMiklos Szeredi static int ovl_unlink(struct inode *dir, struct dentry *dentry)
663e9be9d5eSMiklos Szeredi {
664e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, false);
665e9be9d5eSMiklos Szeredi }
666e9be9d5eSMiklos Szeredi 
667e9be9d5eSMiklos Szeredi static int ovl_rmdir(struct inode *dir, struct dentry *dentry)
668e9be9d5eSMiklos Szeredi {
669e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, true);
670e9be9d5eSMiklos Szeredi }
671e9be9d5eSMiklos Szeredi 
672e9be9d5eSMiklos Szeredi static int ovl_rename2(struct inode *olddir, struct dentry *old,
673e9be9d5eSMiklos Szeredi 		       struct inode *newdir, struct dentry *new,
674e9be9d5eSMiklos Szeredi 		       unsigned int flags)
675e9be9d5eSMiklos Szeredi {
676e9be9d5eSMiklos Szeredi 	int err;
677e9be9d5eSMiklos Szeredi 	enum ovl_path_type old_type;
678e9be9d5eSMiklos Szeredi 	enum ovl_path_type new_type;
679e9be9d5eSMiklos Szeredi 	struct dentry *old_upperdir;
680e9be9d5eSMiklos Szeredi 	struct dentry *new_upperdir;
681e9be9d5eSMiklos Szeredi 	struct dentry *olddentry;
682e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
683e9be9d5eSMiklos Szeredi 	struct dentry *trap;
684e9be9d5eSMiklos Szeredi 	bool old_opaque;
685e9be9d5eSMiklos Szeredi 	bool new_opaque;
686e9be9d5eSMiklos Szeredi 	bool new_create = false;
687e9be9d5eSMiklos Szeredi 	bool cleanup_whiteout = false;
688e9be9d5eSMiklos Szeredi 	bool overwrite = !(flags & RENAME_EXCHANGE);
689e9be9d5eSMiklos Szeredi 	bool is_dir = S_ISDIR(old->d_inode->i_mode);
690e9be9d5eSMiklos Szeredi 	bool new_is_dir = false;
691e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
692e9be9d5eSMiklos Szeredi 	const struct cred *old_cred = NULL;
693e9be9d5eSMiklos Szeredi 	struct cred *override_cred = NULL;
694e9be9d5eSMiklos Szeredi 
695e9be9d5eSMiklos Szeredi 	err = -EINVAL;
696e9be9d5eSMiklos Szeredi 	if (flags & ~(RENAME_EXCHANGE | RENAME_NOREPLACE))
697e9be9d5eSMiklos Szeredi 		goto out;
698e9be9d5eSMiklos Szeredi 
699e9be9d5eSMiklos Szeredi 	flags &= ~RENAME_NOREPLACE;
700e9be9d5eSMiklos Szeredi 
701e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(old);
702e9be9d5eSMiklos Szeredi 	if (err)
703e9be9d5eSMiklos Szeredi 		goto out;
704e9be9d5eSMiklos Szeredi 
705e9be9d5eSMiklos Szeredi 	/* Don't copy up directory trees */
706e9be9d5eSMiklos Szeredi 	old_type = ovl_path_type(old);
707e9be9d5eSMiklos Szeredi 	err = -EXDEV;
708e9be9d5eSMiklos Szeredi 	if ((old_type == OVL_PATH_LOWER || old_type == OVL_PATH_MERGE) && is_dir)
709e9be9d5eSMiklos Szeredi 		goto out;
710e9be9d5eSMiklos Szeredi 
711e9be9d5eSMiklos Szeredi 	if (new->d_inode) {
712e9be9d5eSMiklos Szeredi 		err = ovl_check_sticky(new);
713e9be9d5eSMiklos Szeredi 		if (err)
714e9be9d5eSMiklos Szeredi 			goto out;
715e9be9d5eSMiklos Szeredi 
716e9be9d5eSMiklos Szeredi 		if (S_ISDIR(new->d_inode->i_mode))
717e9be9d5eSMiklos Szeredi 			new_is_dir = true;
718e9be9d5eSMiklos Szeredi 
719e9be9d5eSMiklos Szeredi 		new_type = ovl_path_type(new);
720e9be9d5eSMiklos Szeredi 		err = -EXDEV;
721e9be9d5eSMiklos Szeredi 		if (!overwrite && (new_type == OVL_PATH_LOWER || new_type == OVL_PATH_MERGE) && new_is_dir)
722e9be9d5eSMiklos Szeredi 			goto out;
723e9be9d5eSMiklos Szeredi 
724e9be9d5eSMiklos Szeredi 		err = 0;
725e9be9d5eSMiklos Szeredi 		if (new_type == OVL_PATH_LOWER && old_type == OVL_PATH_LOWER) {
726e9be9d5eSMiklos Szeredi 			if (ovl_dentry_lower(old)->d_inode ==
727e9be9d5eSMiklos Szeredi 			    ovl_dentry_lower(new)->d_inode)
728e9be9d5eSMiklos Szeredi 				goto out;
729e9be9d5eSMiklos Szeredi 		}
730e9be9d5eSMiklos Szeredi 		if (new_type != OVL_PATH_LOWER && old_type != OVL_PATH_LOWER) {
731e9be9d5eSMiklos Szeredi 			if (ovl_dentry_upper(old)->d_inode ==
732e9be9d5eSMiklos Szeredi 			    ovl_dentry_upper(new)->d_inode)
733e9be9d5eSMiklos Szeredi 				goto out;
734e9be9d5eSMiklos Szeredi 		}
735e9be9d5eSMiklos Szeredi 	} else {
736e9be9d5eSMiklos Szeredi 		if (ovl_dentry_is_opaque(new))
737e9be9d5eSMiklos Szeredi 			new_type = OVL_PATH_UPPER;
738e9be9d5eSMiklos Szeredi 		else
739e9be9d5eSMiklos Szeredi 			new_type = OVL_PATH_PURE_UPPER;
740e9be9d5eSMiklos Szeredi 	}
741e9be9d5eSMiklos Szeredi 
742e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
743e9be9d5eSMiklos Szeredi 	if (err)
744e9be9d5eSMiklos Szeredi 		goto out;
745e9be9d5eSMiklos Szeredi 
746e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
747e9be9d5eSMiklos Szeredi 	if (err)
748e9be9d5eSMiklos Szeredi 		goto out_drop_write;
749e9be9d5eSMiklos Szeredi 
750e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(new->d_parent);
751e9be9d5eSMiklos Szeredi 	if (err)
752e9be9d5eSMiklos Szeredi 		goto out_drop_write;
753e9be9d5eSMiklos Szeredi 	if (!overwrite) {
754e9be9d5eSMiklos Szeredi 		err = ovl_copy_up(new);
755e9be9d5eSMiklos Szeredi 		if (err)
756e9be9d5eSMiklos Szeredi 			goto out_drop_write;
757e9be9d5eSMiklos Szeredi 	}
758e9be9d5eSMiklos Szeredi 
759e9be9d5eSMiklos Szeredi 	old_opaque = old_type != OVL_PATH_PURE_UPPER;
760e9be9d5eSMiklos Szeredi 	new_opaque = new_type != OVL_PATH_PURE_UPPER;
761e9be9d5eSMiklos Szeredi 
762e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
763e9be9d5eSMiklos Szeredi 		err = -ENOMEM;
764e9be9d5eSMiklos Szeredi 		override_cred = prepare_creds();
765e9be9d5eSMiklos Szeredi 		if (!override_cred)
766e9be9d5eSMiklos Szeredi 			goto out_drop_write;
767e9be9d5eSMiklos Szeredi 
768e9be9d5eSMiklos Szeredi 		/*
769e9be9d5eSMiklos Szeredi 		 * CAP_SYS_ADMIN for setting xattr on whiteout, opaque dir
770e9be9d5eSMiklos Szeredi 		 * CAP_DAC_OVERRIDE for create in workdir
771e9be9d5eSMiklos Szeredi 		 * CAP_FOWNER for removing whiteout from sticky dir
772e9be9d5eSMiklos Szeredi 		 * CAP_FSETID for chmod of opaque dir
773e9be9d5eSMiklos Szeredi 		 * CAP_CHOWN for chown of opaque dir
774e9be9d5eSMiklos Szeredi 		 */
775e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_SYS_ADMIN);
776e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_DAC_OVERRIDE);
777e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FOWNER);
778e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_FSETID);
779e9be9d5eSMiklos Szeredi 		cap_raise(override_cred->cap_effective, CAP_CHOWN);
780e9be9d5eSMiklos Szeredi 		old_cred = override_creds(override_cred);
781e9be9d5eSMiklos Szeredi 	}
782e9be9d5eSMiklos Szeredi 
783e9be9d5eSMiklos Szeredi 	if (overwrite && (new_type == OVL_PATH_LOWER || new_type == OVL_PATH_MERGE) && new_is_dir) {
784e9be9d5eSMiklos Szeredi 		opaquedir = ovl_check_empty_and_clear(new, new_type);
785e9be9d5eSMiklos Szeredi 		err = PTR_ERR(opaquedir);
786e9be9d5eSMiklos Szeredi 		if (IS_ERR(opaquedir)) {
787e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
788e9be9d5eSMiklos Szeredi 			goto out_revert_creds;
789e9be9d5eSMiklos Szeredi 		}
790e9be9d5eSMiklos Szeredi 	}
791e9be9d5eSMiklos Szeredi 
792e9be9d5eSMiklos Szeredi 	if (overwrite) {
793e9be9d5eSMiklos Szeredi 		if (old_opaque) {
794e9be9d5eSMiklos Szeredi 			if (new->d_inode || !new_opaque) {
795e9be9d5eSMiklos Szeredi 				/* Whiteout source */
796e9be9d5eSMiklos Szeredi 				flags |= RENAME_WHITEOUT;
797e9be9d5eSMiklos Szeredi 			} else {
798e9be9d5eSMiklos Szeredi 				/* Switch whiteouts */
799e9be9d5eSMiklos Szeredi 				flags |= RENAME_EXCHANGE;
800e9be9d5eSMiklos Szeredi 			}
801e9be9d5eSMiklos Szeredi 		} else if (is_dir && !new->d_inode && new_opaque) {
802e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
803e9be9d5eSMiklos Szeredi 			cleanup_whiteout = true;
804e9be9d5eSMiklos Szeredi 		}
805e9be9d5eSMiklos Szeredi 	}
806e9be9d5eSMiklos Szeredi 
807e9be9d5eSMiklos Szeredi 	old_upperdir = ovl_dentry_upper(old->d_parent);
808e9be9d5eSMiklos Szeredi 	new_upperdir = ovl_dentry_upper(new->d_parent);
809e9be9d5eSMiklos Szeredi 
810e9be9d5eSMiklos Szeredi 	trap = lock_rename(new_upperdir, old_upperdir);
811e9be9d5eSMiklos Szeredi 
812e9be9d5eSMiklos Szeredi 	olddentry = ovl_dentry_upper(old);
813e9be9d5eSMiklos Szeredi 	newdentry = ovl_dentry_upper(new);
814e9be9d5eSMiklos Szeredi 	if (newdentry) {
815e9be9d5eSMiklos Szeredi 		if (opaquedir) {
816e9be9d5eSMiklos Szeredi 			newdentry = opaquedir;
817e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
818e9be9d5eSMiklos Szeredi 		} else {
819e9be9d5eSMiklos Szeredi 			dget(newdentry);
820e9be9d5eSMiklos Szeredi 		}
821e9be9d5eSMiklos Szeredi 	} else {
822e9be9d5eSMiklos Szeredi 		new_create = true;
823e9be9d5eSMiklos Szeredi 		newdentry = lookup_one_len(new->d_name.name, new_upperdir,
824e9be9d5eSMiklos Szeredi 					   new->d_name.len);
825e9be9d5eSMiklos Szeredi 		err = PTR_ERR(newdentry);
826e9be9d5eSMiklos Szeredi 		if (IS_ERR(newdentry))
827e9be9d5eSMiklos Szeredi 			goto out_unlock;
828e9be9d5eSMiklos Szeredi 	}
829e9be9d5eSMiklos Szeredi 
830e9be9d5eSMiklos Szeredi 	err = -ESTALE;
831e9be9d5eSMiklos Szeredi 	if (olddentry->d_parent != old_upperdir)
832e9be9d5eSMiklos Szeredi 		goto out_dput;
833e9be9d5eSMiklos Szeredi 	if (newdentry->d_parent != new_upperdir)
834e9be9d5eSMiklos Szeredi 		goto out_dput;
835e9be9d5eSMiklos Szeredi 	if (olddentry == trap)
836e9be9d5eSMiklos Szeredi 		goto out_dput;
837e9be9d5eSMiklos Szeredi 	if (newdentry == trap)
838e9be9d5eSMiklos Szeredi 		goto out_dput;
839e9be9d5eSMiklos Szeredi 
840e9be9d5eSMiklos Szeredi 	if (is_dir && !old_opaque && new_opaque) {
841e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(olddentry);
842e9be9d5eSMiklos Szeredi 		if (err)
843e9be9d5eSMiklos Szeredi 			goto out_dput;
844e9be9d5eSMiklos Szeredi 	}
845e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && old_opaque && !new_opaque) {
846e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
847e9be9d5eSMiklos Szeredi 		if (err)
848e9be9d5eSMiklos Szeredi 			goto out_dput;
849e9be9d5eSMiklos Szeredi 	}
850e9be9d5eSMiklos Szeredi 
851e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
852e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(old_upperdir->d_inode, olddentry,
853e9be9d5eSMiklos Szeredi 				    new_upperdir->d_inode, newdentry,
854e9be9d5eSMiklos Szeredi 				    flags);
855e9be9d5eSMiklos Szeredi 	} else {
856e9be9d5eSMiklos Szeredi 		/* No debug for the plain case */
857e9be9d5eSMiklos Szeredi 		BUG_ON(flags & ~RENAME_EXCHANGE);
858e9be9d5eSMiklos Szeredi 		err = vfs_rename(old_upperdir->d_inode, olddentry,
859e9be9d5eSMiklos Szeredi 				 new_upperdir->d_inode, newdentry,
860e9be9d5eSMiklos Szeredi 				 NULL, flags);
861e9be9d5eSMiklos Szeredi 	}
862e9be9d5eSMiklos Szeredi 
863e9be9d5eSMiklos Szeredi 	if (err) {
864e9be9d5eSMiklos Szeredi 		if (is_dir && !old_opaque && new_opaque)
865e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(olddentry);
866e9be9d5eSMiklos Szeredi 		if (!overwrite && new_is_dir && old_opaque && !new_opaque)
867e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(newdentry);
868e9be9d5eSMiklos Szeredi 		goto out_dput;
869e9be9d5eSMiklos Szeredi 	}
870e9be9d5eSMiklos Szeredi 
871e9be9d5eSMiklos Szeredi 	if (is_dir && old_opaque && !new_opaque)
872e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(olddentry);
873e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && !old_opaque && new_opaque)
874e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(newdentry);
875e9be9d5eSMiklos Szeredi 
876e9be9d5eSMiklos Szeredi 	if (old_opaque != new_opaque) {
877e9be9d5eSMiklos Szeredi 		ovl_dentry_set_opaque(old, new_opaque);
878e9be9d5eSMiklos Szeredi 		if (!overwrite)
879e9be9d5eSMiklos Szeredi 			ovl_dentry_set_opaque(new, old_opaque);
880e9be9d5eSMiklos Szeredi 	}
881e9be9d5eSMiklos Szeredi 
882e9be9d5eSMiklos Szeredi 	if (cleanup_whiteout)
883e9be9d5eSMiklos Szeredi 		ovl_cleanup(old_upperdir->d_inode, newdentry);
884e9be9d5eSMiklos Szeredi 
885e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(old->d_parent);
886e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(new->d_parent);
887e9be9d5eSMiklos Szeredi 
888e9be9d5eSMiklos Szeredi out_dput:
889e9be9d5eSMiklos Szeredi 	dput(newdentry);
890e9be9d5eSMiklos Szeredi out_unlock:
891e9be9d5eSMiklos Szeredi 	unlock_rename(new_upperdir, old_upperdir);
892e9be9d5eSMiklos Szeredi out_revert_creds:
893e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
894e9be9d5eSMiklos Szeredi 		revert_creds(old_cred);
895e9be9d5eSMiklos Szeredi 		put_cred(override_cred);
896e9be9d5eSMiklos Szeredi 	}
897e9be9d5eSMiklos Szeredi out_drop_write:
898e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
899e9be9d5eSMiklos Szeredi out:
900e9be9d5eSMiklos Szeredi 	dput(opaquedir);
901e9be9d5eSMiklos Szeredi 	return err;
902e9be9d5eSMiklos Szeredi }
903e9be9d5eSMiklos Szeredi 
904e9be9d5eSMiklos Szeredi const struct inode_operations ovl_dir_inode_operations = {
905e9be9d5eSMiklos Szeredi 	.lookup		= ovl_lookup,
906e9be9d5eSMiklos Szeredi 	.mkdir		= ovl_mkdir,
907e9be9d5eSMiklos Szeredi 	.symlink	= ovl_symlink,
908e9be9d5eSMiklos Szeredi 	.unlink		= ovl_unlink,
909e9be9d5eSMiklos Szeredi 	.rmdir		= ovl_rmdir,
910e9be9d5eSMiklos Szeredi 	.rename2	= ovl_rename2,
911e9be9d5eSMiklos Szeredi 	.link		= ovl_link,
912e9be9d5eSMiklos Szeredi 	.setattr	= ovl_setattr,
913e9be9d5eSMiklos Szeredi 	.create		= ovl_create,
914e9be9d5eSMiklos Szeredi 	.mknod		= ovl_mknod,
915e9be9d5eSMiklos Szeredi 	.permission	= ovl_permission,
916e9be9d5eSMiklos Szeredi 	.getattr	= ovl_dir_getattr,
917e9be9d5eSMiklos Szeredi 	.setxattr	= ovl_setxattr,
918e9be9d5eSMiklos Szeredi 	.getxattr	= ovl_getxattr,
919e9be9d5eSMiklos Szeredi 	.listxattr	= ovl_listxattr,
920e9be9d5eSMiklos Szeredi 	.removexattr	= ovl_removexattr,
921e9be9d5eSMiklos Szeredi };
922