fs/btrfs/subpage.c

cac06d84SQu Wenruo// SPDX-License-Identifier: GPL-2.0
cac06d84SQu Wenruo
cac06d84SQu Wenruo#include <linux/slab.h>
cac06d84SQu Wenruo#include "ctree.h"
cac06d84SQu Wenruo#include "subpage.h"
3d078efaSQu Wenruo#include "btrfs_inode.h"
cac06d84SQu Wenruo
894d1378SQu Wenruo/*
894d1378SQu Wenruo * Subpage (sectorsize < PAGE_SIZE) support overview:
894d1378SQu Wenruo *
894d1378SQu Wenruo * Limitations:
894d1378SQu Wenruo *
894d1378SQu Wenruo * - Only support 64K page size for now
894d1378SQu Wenruo *   This is to make metadata handling easier, as 64K page would ensure
894d1378SQu Wenruo *   all nodesize would fit inside one page, thus we don't need to handle
894d1378SQu Wenruo *   cases where a tree block crosses several pages.
894d1378SQu Wenruo *
894d1378SQu Wenruo * - Only metadata read-write for now
894d1378SQu Wenruo *   The data read-write part is in development.
894d1378SQu Wenruo *
894d1378SQu Wenruo * - Metadata can't cross 64K page boundary
894d1378SQu Wenruo *   btrfs-progs and kernel have done that for a while, thus only ancient
894d1378SQu Wenruo *   filesystems could have such problem.  For such case, do a graceful
894d1378SQu Wenruo *   rejection.
894d1378SQu Wenruo *
894d1378SQu Wenruo * Special behavior:
894d1378SQu Wenruo *
894d1378SQu Wenruo * - Metadata
894d1378SQu Wenruo *   Metadata read is fully supported.
894d1378SQu Wenruo *   Meaning when reading one tree block will only trigger the read for the
894d1378SQu Wenruo *   needed range, other unrelated range in the same page will not be touched.
894d1378SQu Wenruo *
894d1378SQu Wenruo *   Metadata write support is partial.
894d1378SQu Wenruo *   The writeback is still for the full page, but we will only submit
894d1378SQu Wenruo *   the dirty extent buffers in the page.
894d1378SQu Wenruo *
894d1378SQu Wenruo *   This means, if we have a metadata page like this:
894d1378SQu Wenruo *
894d1378SQu Wenruo *   Page offset
894d1378SQu Wenruo *   0         16K         32K         48K        64K
894d1378SQu Wenruo *   |/////////|           |///////////|
894d1378SQu Wenruo *        \- Tree block A        \- Tree block B
894d1378SQu Wenruo *
894d1378SQu Wenruo *   Even if we just want to writeback tree block A, we will also writeback
894d1378SQu Wenruo *   tree block B if it's also dirty.
894d1378SQu Wenruo *
894d1378SQu Wenruo *   This may cause extra metadata writeback which results more COW.
894d1378SQu Wenruo *
894d1378SQu Wenruo * Implementation:
894d1378SQu Wenruo *
894d1378SQu Wenruo * - Common
894d1378SQu Wenruo *   Both metadata and data will use a new structure, btrfs_subpage, to
894d1378SQu Wenruo *   record the status of each sector inside a page.  This provides the extra
894d1378SQu Wenruo *   granularity needed.
894d1378SQu Wenruo *
894d1378SQu Wenruo * - Metadata
894d1378SQu Wenruo *   Since we have multiple tree blocks inside one page, we can't rely on page
894d1378SQu Wenruo *   locking anymore, or we will have greatly reduced concurrency or even
894d1378SQu Wenruo *   deadlocks (hold one tree lock while trying to lock another tree lock in
894d1378SQu Wenruo *   the same page).
894d1378SQu Wenruo *
894d1378SQu Wenruo *   Thus for metadata locking, subpage support relies on io_tree locking only.
894d1378SQu Wenruo *   This means a slightly higher tree locking latency.
894d1378SQu Wenruo */
894d1378SQu Wenruo
*8481dd80SQu Wenruovoid btrfs_init_subpage_info(struct btrfs_subpage_info *subpage_info, u32 sectorsize)
*8481dd80SQu Wenruo{
*8481dd80SQu Wenruo	unsigned int cur = 0;
*8481dd80SQu Wenruo	unsigned int nr_bits;
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	ASSERT(IS_ALIGNED(PAGE_SIZE, sectorsize));
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	nr_bits = PAGE_SIZE / sectorsize;
*8481dd80SQu Wenruo	subpage_info->bitmap_nr_bits = nr_bits;
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	subpage_info->uptodate_offset = cur;
*8481dd80SQu Wenruo	cur += nr_bits;
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	subpage_info->error_offset = cur;
*8481dd80SQu Wenruo	cur += nr_bits;
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	subpage_info->dirty_offset = cur;
*8481dd80SQu Wenruo	cur += nr_bits;
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	subpage_info->writeback_offset = cur;
*8481dd80SQu Wenruo	cur += nr_bits;
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	subpage_info->ordered_offset = cur;
*8481dd80SQu Wenruo	cur += nr_bits;
*8481dd80SQu Wenruo
*8481dd80SQu Wenruo	subpage_info->total_nr_bits = cur;
*8481dd80SQu Wenruo}
*8481dd80SQu Wenruo
cac06d84SQu Wenruoint btrfs_attach_subpage(const struct btrfs_fs_info *fs_info,
cac06d84SQu Wenruo			 struct page *page, enum btrfs_subpage_type type)
cac06d84SQu Wenruo{
651fb419SQu Wenruo	struct btrfs_subpage *subpage;
cac06d84SQu Wenruo
cac06d84SQu Wenruo	/*
cac06d84SQu Wenruo	 * We have cases like a dummy extent buffer page, which is not mappped
cac06d84SQu Wenruo	 * and doesn't need to be locked.
cac06d84SQu Wenruo	 */
cac06d84SQu Wenruo	if (page->mapping)
cac06d84SQu Wenruo		ASSERT(PageLocked(page));
651fb419SQu Wenruo
cac06d84SQu Wenruo	/* Either not subpage, or the page already has private attached */
cac06d84SQu Wenruo	if (fs_info->sectorsize == PAGE_SIZE || PagePrivate(page))
cac06d84SQu Wenruo		return 0;
cac06d84SQu Wenruo
651fb419SQu Wenruo	subpage = btrfs_alloc_subpage(fs_info, type);
651fb419SQu Wenruo	if (IS_ERR(subpage))
651fb419SQu Wenruo		return  PTR_ERR(subpage);
651fb419SQu Wenruo
cac06d84SQu Wenruo	attach_page_private(page, subpage);
cac06d84SQu Wenruo	return 0;
cac06d84SQu Wenruo}
cac06d84SQu Wenruo
cac06d84SQu Wenruovoid btrfs_detach_subpage(const struct btrfs_fs_info *fs_info,
cac06d84SQu Wenruo			  struct page *page)
cac06d84SQu Wenruo{
cac06d84SQu Wenruo	struct btrfs_subpage *subpage;
cac06d84SQu Wenruo
cac06d84SQu Wenruo	/* Either not subpage, or already detached */
cac06d84SQu Wenruo	if (fs_info->sectorsize == PAGE_SIZE || !PagePrivate(page))
cac06d84SQu Wenruo		return;
cac06d84SQu Wenruo
cac06d84SQu Wenruo	subpage = (struct btrfs_subpage *)detach_page_private(page);
cac06d84SQu Wenruo	ASSERT(subpage);
760f991fSQu Wenruo	btrfs_free_subpage(subpage);
760f991fSQu Wenruo}
760f991fSQu Wenruo
651fb419SQu Wenruostruct btrfs_subpage *btrfs_alloc_subpage(const struct btrfs_fs_info *fs_info,
760f991fSQu Wenruo					  enum btrfs_subpage_type type)
760f991fSQu Wenruo{
651fb419SQu Wenruo	struct btrfs_subpage *ret;
651fb419SQu Wenruo
fdf250dbSQu Wenruo	ASSERT(fs_info->sectorsize < PAGE_SIZE);
760f991fSQu Wenruo
651fb419SQu Wenruo	ret = kzalloc(sizeof(struct btrfs_subpage), GFP_NOFS);
651fb419SQu Wenruo	if (!ret)
651fb419SQu Wenruo		return ERR_PTR(-ENOMEM);
651fb419SQu Wenruo
651fb419SQu Wenruo	spin_lock_init(&ret->lock);
1e1de387SQu Wenruo	if (type == BTRFS_SUBPAGE_METADATA) {
651fb419SQu Wenruo		atomic_set(&ret->eb_refs, 0);
1e1de387SQu Wenruo	} else {
651fb419SQu Wenruo		atomic_set(&ret->readers, 0);
651fb419SQu Wenruo		atomic_set(&ret->writers, 0);
1e1de387SQu Wenruo	}
651fb419SQu Wenruo	return ret;
760f991fSQu Wenruo}
760f991fSQu Wenruo
760f991fSQu Wenruovoid btrfs_free_subpage(struct btrfs_subpage *subpage)
760f991fSQu Wenruo{
cac06d84SQu Wenruo	kfree(subpage);
cac06d84SQu Wenruo}
8ff8466dSQu Wenruo
8ff8466dSQu Wenruo/*
8ff8466dSQu Wenruo * Increase the eb_refs of current subpage.
8ff8466dSQu Wenruo *
8ff8466dSQu Wenruo * This is important for eb allocation, to prevent race with last eb freeing
8ff8466dSQu Wenruo * of the same page.
8ff8466dSQu Wenruo * With the eb_refs increased before the eb inserted into radix tree,
8ff8466dSQu Wenruo * detach_extent_buffer_page() won't detach the page private while we're still
8ff8466dSQu Wenruo * allocating the extent buffer.
8ff8466dSQu Wenruo */
8ff8466dSQu Wenruovoid btrfs_page_inc_eb_refs(const struct btrfs_fs_info *fs_info,
8ff8466dSQu Wenruo			    struct page *page)
8ff8466dSQu Wenruo{
8ff8466dSQu Wenruo	struct btrfs_subpage *subpage;
8ff8466dSQu Wenruo
8ff8466dSQu Wenruo	if (fs_info->sectorsize == PAGE_SIZE)
8ff8466dSQu Wenruo		return;
8ff8466dSQu Wenruo
8ff8466dSQu Wenruo	ASSERT(PagePrivate(page) && page->mapping);
8ff8466dSQu Wenruo	lockdep_assert_held(&page->mapping->private_lock);
8ff8466dSQu Wenruo
8ff8466dSQu Wenruo	subpage = (struct btrfs_subpage *)page->private;
8ff8466dSQu Wenruo	atomic_inc(&subpage->eb_refs);
8ff8466dSQu Wenruo}
8ff8466dSQu Wenruo
8ff8466dSQu Wenruovoid btrfs_page_dec_eb_refs(const struct btrfs_fs_info *fs_info,
8ff8466dSQu Wenruo			    struct page *page)
8ff8466dSQu Wenruo{
8ff8466dSQu Wenruo	struct btrfs_subpage *subpage;
8ff8466dSQu Wenruo
8ff8466dSQu Wenruo	if (fs_info->sectorsize == PAGE_SIZE)
8ff8466dSQu Wenruo		return;
8ff8466dSQu Wenruo
8ff8466dSQu Wenruo	ASSERT(PagePrivate(page) && page->mapping);
8ff8466dSQu Wenruo	lockdep_assert_held(&page->mapping->private_lock);
8ff8466dSQu Wenruo
8ff8466dSQu Wenruo	subpage = (struct btrfs_subpage *)page->private;
8ff8466dSQu Wenruo	ASSERT(atomic_read(&subpage->eb_refs));
8ff8466dSQu Wenruo	atomic_dec(&subpage->eb_refs);
8ff8466dSQu Wenruo}
a1d767c1SQu Wenruo
92082d40SQu Wenruostatic void btrfs_subpage_assert(const struct btrfs_fs_info *fs_info,
92082d40SQu Wenruo		struct page *page, u64 start, u32 len)
92082d40SQu Wenruo{
92082d40SQu Wenruo	/* Basic checks */
92082d40SQu Wenruo	ASSERT(PagePrivate(page) && page->private);
92082d40SQu Wenruo	ASSERT(IS_ALIGNED(start, fs_info->sectorsize) &&
92082d40SQu Wenruo	       IS_ALIGNED(len, fs_info->sectorsize));
92082d40SQu Wenruo	/*
92082d40SQu Wenruo	 * The range check only works for mapped page, we can still have
92082d40SQu Wenruo	 * unmapped page like dummy extent buffer pages.
92082d40SQu Wenruo	 */
92082d40SQu Wenruo	if (page->mapping)
92082d40SQu Wenruo		ASSERT(page_offset(page) <= start &&
92082d40SQu Wenruo		       start + len <= page_offset(page) + PAGE_SIZE);
92082d40SQu Wenruo}
92082d40SQu Wenruo
92082d40SQu Wenruovoid btrfs_subpage_start_reader(const struct btrfs_fs_info *fs_info,
92082d40SQu Wenruo		struct page *page, u64 start, u32 len)
92082d40SQu Wenruo{
92082d40SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
92082d40SQu Wenruo	const int nbits = len >> fs_info->sectorsize_bits;
92082d40SQu Wenruo
92082d40SQu Wenruo	btrfs_subpage_assert(fs_info, page, start, len);
92082d40SQu Wenruo
3d078efaSQu Wenruo	atomic_add(nbits, &subpage->readers);
92082d40SQu Wenruo}
92082d40SQu Wenruo
92082d40SQu Wenruovoid btrfs_subpage_end_reader(const struct btrfs_fs_info *fs_info,
92082d40SQu Wenruo		struct page *page, u64 start, u32 len)
92082d40SQu Wenruo{
92082d40SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
92082d40SQu Wenruo	const int nbits = len >> fs_info->sectorsize_bits;
3d078efaSQu Wenruo	bool is_data;
3d078efaSQu Wenruo	bool last;
92082d40SQu Wenruo
92082d40SQu Wenruo	btrfs_subpage_assert(fs_info, page, start, len);
3d078efaSQu Wenruo	is_data = is_data_inode(page->mapping->host);
92082d40SQu Wenruo	ASSERT(atomic_read(&subpage->readers) >= nbits);
3d078efaSQu Wenruo	last = atomic_sub_and_test(nbits, &subpage->readers);
3d078efaSQu Wenruo
3d078efaSQu Wenruo	/*
3d078efaSQu Wenruo	 * For data we need to unlock the page if the last read has finished.
3d078efaSQu Wenruo	 *
3d078efaSQu Wenruo	 * And please don't replace @last with atomic_sub_and_test() call
3d078efaSQu Wenruo	 * inside if () condition.
3d078efaSQu Wenruo	 * As we want the atomic_sub_and_test() to be always executed.
3d078efaSQu Wenruo	 */
3d078efaSQu Wenruo	if (is_data && last)
92082d40SQu Wenruo		unlock_page(page);
92082d40SQu Wenruo}
92082d40SQu Wenruo
1e1de387SQu Wenruostatic void btrfs_subpage_clamp_range(struct page *page, u64 *start, u32 *len)
1e1de387SQu Wenruo{
1e1de387SQu Wenruo	u64 orig_start = *start;
1e1de387SQu Wenruo	u32 orig_len = *len;
1e1de387SQu Wenruo
1e1de387SQu Wenruo	*start = max_t(u64, page_offset(page), orig_start);
1e1de387SQu Wenruo	*len = min_t(u64, page_offset(page) + PAGE_SIZE,
1e1de387SQu Wenruo		     orig_start + orig_len) - *start;
1e1de387SQu Wenruo}
1e1de387SQu Wenruo
1e1de387SQu Wenruovoid btrfs_subpage_start_writer(const struct btrfs_fs_info *fs_info,
1e1de387SQu Wenruo		struct page *page, u64 start, u32 len)
1e1de387SQu Wenruo{
1e1de387SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
1e1de387SQu Wenruo	const int nbits = (len >> fs_info->sectorsize_bits);
1e1de387SQu Wenruo	int ret;
1e1de387SQu Wenruo
1e1de387SQu Wenruo	btrfs_subpage_assert(fs_info, page, start, len);
1e1de387SQu Wenruo
1e1de387SQu Wenruo	ASSERT(atomic_read(&subpage->readers) == 0);
1e1de387SQu Wenruo	ret = atomic_add_return(nbits, &subpage->writers);
1e1de387SQu Wenruo	ASSERT(ret == nbits);
1e1de387SQu Wenruo}
1e1de387SQu Wenruo
1e1de387SQu Wenruobool btrfs_subpage_end_and_test_writer(const struct btrfs_fs_info *fs_info,
1e1de387SQu Wenruo		struct page *page, u64 start, u32 len)
1e1de387SQu Wenruo{
1e1de387SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
1e1de387SQu Wenruo	const int nbits = (len >> fs_info->sectorsize_bits);
1e1de387SQu Wenruo
1e1de387SQu Wenruo	btrfs_subpage_assert(fs_info, page, start, len);
1e1de387SQu Wenruo
1e1de387SQu Wenruo	ASSERT(atomic_read(&subpage->writers) >= nbits);
1e1de387SQu Wenruo	return atomic_sub_and_test(nbits, &subpage->writers);
1e1de387SQu Wenruo}
1e1de387SQu Wenruo
1e1de387SQu Wenruo/*
1e1de387SQu Wenruo * Lock a page for delalloc page writeback.
1e1de387SQu Wenruo *
1e1de387SQu Wenruo * Return -EAGAIN if the page is not properly initialized.
1e1de387SQu Wenruo * Return 0 with the page locked, and writer counter updated.
1e1de387SQu Wenruo *
1e1de387SQu Wenruo * Even with 0 returned, the page still need extra check to make sure
1e1de387SQu Wenruo * it's really the correct page, as the caller is using
1e1de387SQu Wenruo * find_get_pages_contig(), which can race with page invalidating.
1e1de387SQu Wenruo */
1e1de387SQu Wenruoint btrfs_page_start_writer_lock(const struct btrfs_fs_info *fs_info,
1e1de387SQu Wenruo		struct page *page, u64 start, u32 len)
1e1de387SQu Wenruo{
1e1de387SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE) {
1e1de387SQu Wenruo		lock_page(page);
1e1de387SQu Wenruo		return 0;
1e1de387SQu Wenruo	}
1e1de387SQu Wenruo	lock_page(page);
1e1de387SQu Wenruo	if (!PagePrivate(page) || !page->private) {
1e1de387SQu Wenruo		unlock_page(page);
1e1de387SQu Wenruo		return -EAGAIN;
1e1de387SQu Wenruo	}
1e1de387SQu Wenruo	btrfs_subpage_clamp_range(page, &start, &len);
1e1de387SQu Wenruo	btrfs_subpage_start_writer(fs_info, page, start, len);
1e1de387SQu Wenruo	return 0;
1e1de387SQu Wenruo}
1e1de387SQu Wenruo
1e1de387SQu Wenruovoid btrfs_page_end_writer_lock(const struct btrfs_fs_info *fs_info,
1e1de387SQu Wenruo		struct page *page, u64 start, u32 len)
1e1de387SQu Wenruo{
1e1de387SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE)
1e1de387SQu Wenruo		return unlock_page(page);
1e1de387SQu Wenruo	btrfs_subpage_clamp_range(page, &start, &len);
1e1de387SQu Wenruo	if (btrfs_subpage_end_and_test_writer(fs_info, page, start, len))
1e1de387SQu Wenruo		unlock_page(page);
1e1de387SQu Wenruo}
1e1de387SQu Wenruo
a1d767c1SQu Wenruo/*
a1d767c1SQu Wenruo * Convert the [start, start + len) range into a u16 bitmap
a1d767c1SQu Wenruo *
a1d767c1SQu Wenruo * For example: if start == page_offset() + 16K, len = 16K, we get 0x00f0.
a1d767c1SQu Wenruo */
a1d767c1SQu Wenruostatic u16 btrfs_subpage_calc_bitmap(const struct btrfs_fs_info *fs_info,
a1d767c1SQu Wenruo		struct page *page, u64 start, u32 len)
a1d767c1SQu Wenruo{
a1d767c1SQu Wenruo	const int bit_start = offset_in_page(start) >> fs_info->sectorsize_bits;
a1d767c1SQu Wenruo	const int nbits = len >> fs_info->sectorsize_bits;
a1d767c1SQu Wenruo
92082d40SQu Wenruo	btrfs_subpage_assert(fs_info, page, start, len);
a1d767c1SQu Wenruo
a1d767c1SQu Wenruo	/*
a1d767c1SQu Wenruo	 * Here nbits can be 16, thus can go beyond u16 range. We make the
a1d767c1SQu Wenruo	 * first left shift to be calculate in unsigned long (at least u32),
a1d767c1SQu Wenruo	 * then truncate the result to u16.
a1d767c1SQu Wenruo	 */
a1d767c1SQu Wenruo	return (u16)(((1UL << nbits) - 1) << bit_start);
a1d767c1SQu Wenruo}
a1d767c1SQu Wenruo
a1d767c1SQu Wenruovoid btrfs_subpage_set_uptodate(const struct btrfs_fs_info *fs_info,
a1d767c1SQu Wenruo		struct page *page, u64 start, u32 len)
a1d767c1SQu Wenruo{
a1d767c1SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
a1d767c1SQu Wenruo	const u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
a1d767c1SQu Wenruo	unsigned long flags;
a1d767c1SQu Wenruo
a1d767c1SQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
a1d767c1SQu Wenruo	subpage->uptodate_bitmap |= tmp;
a1d767c1SQu Wenruo	if (subpage->uptodate_bitmap == U16_MAX)
a1d767c1SQu Wenruo		SetPageUptodate(page);
a1d767c1SQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
a1d767c1SQu Wenruo}
a1d767c1SQu Wenruo
a1d767c1SQu Wenruovoid btrfs_subpage_clear_uptodate(const struct btrfs_fs_info *fs_info,
a1d767c1SQu Wenruo		struct page *page, u64 start, u32 len)
a1d767c1SQu Wenruo{
a1d767c1SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
a1d767c1SQu Wenruo	const u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
a1d767c1SQu Wenruo	unsigned long flags;
a1d767c1SQu Wenruo
a1d767c1SQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
a1d767c1SQu Wenruo	subpage->uptodate_bitmap &= ~tmp;
a1d767c1SQu Wenruo	ClearPageUptodate(page);
a1d767c1SQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
a1d767c1SQu Wenruo}
a1d767c1SQu Wenruo
03a816b3SQu Wenruovoid btrfs_subpage_set_error(const struct btrfs_fs_info *fs_info,
03a816b3SQu Wenruo		struct page *page, u64 start, u32 len)
03a816b3SQu Wenruo{
03a816b3SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
03a816b3SQu Wenruo	const u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
03a816b3SQu Wenruo	unsigned long flags;
03a816b3SQu Wenruo
03a816b3SQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
03a816b3SQu Wenruo	subpage->error_bitmap |= tmp;
03a816b3SQu Wenruo	SetPageError(page);
03a816b3SQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
03a816b3SQu Wenruo}
03a816b3SQu Wenruo
03a816b3SQu Wenruovoid btrfs_subpage_clear_error(const struct btrfs_fs_info *fs_info,
03a816b3SQu Wenruo		struct page *page, u64 start, u32 len)
03a816b3SQu Wenruo{
03a816b3SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
03a816b3SQu Wenruo	const u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
03a816b3SQu Wenruo	unsigned long flags;
03a816b3SQu Wenruo
03a816b3SQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
03a816b3SQu Wenruo	subpage->error_bitmap &= ~tmp;
03a816b3SQu Wenruo	if (subpage->error_bitmap == 0)
03a816b3SQu Wenruo		ClearPageError(page);
03a816b3SQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
03a816b3SQu Wenruo}
03a816b3SQu Wenruo
d8a5713eSQu Wenruovoid btrfs_subpage_set_dirty(const struct btrfs_fs_info *fs_info,
d8a5713eSQu Wenruo		struct page *page, u64 start, u32 len)
d8a5713eSQu Wenruo{
d8a5713eSQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
d8a5713eSQu Wenruo	u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
d8a5713eSQu Wenruo	unsigned long flags;
d8a5713eSQu Wenruo
d8a5713eSQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
d8a5713eSQu Wenruo	subpage->dirty_bitmap |= tmp;
d8a5713eSQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
d8a5713eSQu Wenruo	set_page_dirty(page);
d8a5713eSQu Wenruo}
d8a5713eSQu Wenruo
d8a5713eSQu Wenruo/*
d8a5713eSQu Wenruo * Extra clear_and_test function for subpage dirty bitmap.
d8a5713eSQu Wenruo *
d8a5713eSQu Wenruo * Return true if we're the last bits in the dirty_bitmap and clear the
d8a5713eSQu Wenruo * dirty_bitmap.
d8a5713eSQu Wenruo * Return false otherwise.
d8a5713eSQu Wenruo *
d8a5713eSQu Wenruo * NOTE: Callers should manually clear page dirty for true case, as we have
d8a5713eSQu Wenruo * extra handling for tree blocks.
d8a5713eSQu Wenruo */
d8a5713eSQu Wenruobool btrfs_subpage_clear_and_test_dirty(const struct btrfs_fs_info *fs_info,
d8a5713eSQu Wenruo		struct page *page, u64 start, u32 len)
d8a5713eSQu Wenruo{
d8a5713eSQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
d8a5713eSQu Wenruo	u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
d8a5713eSQu Wenruo	unsigned long flags;
d8a5713eSQu Wenruo	bool last = false;
d8a5713eSQu Wenruo
d8a5713eSQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
d8a5713eSQu Wenruo	subpage->dirty_bitmap &= ~tmp;
d8a5713eSQu Wenruo	if (subpage->dirty_bitmap == 0)
d8a5713eSQu Wenruo		last = true;
d8a5713eSQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
d8a5713eSQu Wenruo	return last;
d8a5713eSQu Wenruo}
d8a5713eSQu Wenruo
d8a5713eSQu Wenruovoid btrfs_subpage_clear_dirty(const struct btrfs_fs_info *fs_info,
d8a5713eSQu Wenruo		struct page *page, u64 start, u32 len)
d8a5713eSQu Wenruo{
d8a5713eSQu Wenruo	bool last;
d8a5713eSQu Wenruo
d8a5713eSQu Wenruo	last = btrfs_subpage_clear_and_test_dirty(fs_info, page, start, len);
d8a5713eSQu Wenruo	if (last)
d8a5713eSQu Wenruo		clear_page_dirty_for_io(page);
d8a5713eSQu Wenruo}
d8a5713eSQu Wenruo
3470da3bSQu Wenruovoid btrfs_subpage_set_writeback(const struct btrfs_fs_info *fs_info,
3470da3bSQu Wenruo		struct page *page, u64 start, u32 len)
3470da3bSQu Wenruo{
3470da3bSQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
3470da3bSQu Wenruo	u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
3470da3bSQu Wenruo	unsigned long flags;
3470da3bSQu Wenruo
3470da3bSQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
3470da3bSQu Wenruo	subpage->writeback_bitmap |= tmp;
3470da3bSQu Wenruo	set_page_writeback(page);
3470da3bSQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
3470da3bSQu Wenruo}
3470da3bSQu Wenruo
3470da3bSQu Wenruovoid btrfs_subpage_clear_writeback(const struct btrfs_fs_info *fs_info,
3470da3bSQu Wenruo		struct page *page, u64 start, u32 len)
3470da3bSQu Wenruo{
3470da3bSQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
3470da3bSQu Wenruo	u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
3470da3bSQu Wenruo	unsigned long flags;
3470da3bSQu Wenruo
3470da3bSQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
3470da3bSQu Wenruo	subpage->writeback_bitmap &= ~tmp;
7c11d0aeSQu Wenruo	if (subpage->writeback_bitmap == 0) {
7c11d0aeSQu Wenruo		ASSERT(PageWriteback(page));
3470da3bSQu Wenruo		end_page_writeback(page);
7c11d0aeSQu Wenruo	}
3470da3bSQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
3470da3bSQu Wenruo}
3470da3bSQu Wenruo
6f17400bSQu Wenruovoid btrfs_subpage_set_ordered(const struct btrfs_fs_info *fs_info,
6f17400bSQu Wenruo		struct page *page, u64 start, u32 len)
6f17400bSQu Wenruo{
6f17400bSQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
6f17400bSQu Wenruo	const u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
6f17400bSQu Wenruo	unsigned long flags;
6f17400bSQu Wenruo
6f17400bSQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
6f17400bSQu Wenruo	subpage->ordered_bitmap |= tmp;
6f17400bSQu Wenruo	SetPageOrdered(page);
6f17400bSQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
6f17400bSQu Wenruo}
6f17400bSQu Wenruo
6f17400bSQu Wenruovoid btrfs_subpage_clear_ordered(const struct btrfs_fs_info *fs_info,
6f17400bSQu Wenruo		struct page *page, u64 start, u32 len)
6f17400bSQu Wenruo{
6f17400bSQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
6f17400bSQu Wenruo	const u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len);
6f17400bSQu Wenruo	unsigned long flags;
6f17400bSQu Wenruo
6f17400bSQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);
6f17400bSQu Wenruo	subpage->ordered_bitmap &= ~tmp;
6f17400bSQu Wenruo	if (subpage->ordered_bitmap == 0)
6f17400bSQu Wenruo		ClearPageOrdered(page);
6f17400bSQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);
6f17400bSQu Wenruo}
a1d767c1SQu Wenruo/*
a1d767c1SQu Wenruo * Unlike set/clear which is dependent on each page status, for test all bits
a1d767c1SQu Wenruo * are tested in the same way.
a1d767c1SQu Wenruo */
a1d767c1SQu Wenruo#define IMPLEMENT_BTRFS_SUBPAGE_TEST_OP(name)				\
a1d767c1SQu Wenruobool btrfs_subpage_test_##name(const struct btrfs_fs_info *fs_info,	\
a1d767c1SQu Wenruo		struct page *page, u64 start, u32 len)			\
a1d767c1SQu Wenruo{									\
a1d767c1SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private; \
a1d767c1SQu Wenruo	const u16 tmp = btrfs_subpage_calc_bitmap(fs_info, page, start, len); \
a1d767c1SQu Wenruo	unsigned long flags;						\
a1d767c1SQu Wenruo	bool ret;							\
a1d767c1SQu Wenruo									\
a1d767c1SQu Wenruo	spin_lock_irqsave(&subpage->lock, flags);			\
a1d767c1SQu Wenruo	ret = ((subpage->name##_bitmap & tmp) == tmp);			\
a1d767c1SQu Wenruo	spin_unlock_irqrestore(&subpage->lock, flags);			\
a1d767c1SQu Wenruo	return ret;							\
a1d767c1SQu Wenruo}
a1d767c1SQu WenruoIMPLEMENT_BTRFS_SUBPAGE_TEST_OP(uptodate);
03a816b3SQu WenruoIMPLEMENT_BTRFS_SUBPAGE_TEST_OP(error);
d8a5713eSQu WenruoIMPLEMENT_BTRFS_SUBPAGE_TEST_OP(dirty);
3470da3bSQu WenruoIMPLEMENT_BTRFS_SUBPAGE_TEST_OP(writeback);
6f17400bSQu WenruoIMPLEMENT_BTRFS_SUBPAGE_TEST_OP(ordered);
a1d767c1SQu Wenruo
a1d767c1SQu Wenruo/*
a1d767c1SQu Wenruo * Note that, in selftests (extent-io-tests), we can have empty fs_info passed
a1d767c1SQu Wenruo * in.  We only test sectorsize == PAGE_SIZE cases so far, thus we can fall
a1d767c1SQu Wenruo * back to regular sectorsize branch.
a1d767c1SQu Wenruo */
a1d767c1SQu Wenruo#define IMPLEMENT_BTRFS_PAGE_OPS(name, set_page_func, clear_page_func,	\
a1d767c1SQu Wenruo			       test_page_func)				\
a1d767c1SQu Wenruovoid btrfs_page_set_##name(const struct btrfs_fs_info *fs_info,		\
a1d767c1SQu Wenruo		struct page *page, u64 start, u32 len)			\
a1d767c1SQu Wenruo{									\
a1d767c1SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE) {	\
a1d767c1SQu Wenruo		set_page_func(page);					\
a1d767c1SQu Wenruo		return;							\
a1d767c1SQu Wenruo	}								\
a1d767c1SQu Wenruo	btrfs_subpage_set_##name(fs_info, page, start, len);		\
a1d767c1SQu Wenruo}									\
a1d767c1SQu Wenruovoid btrfs_page_clear_##name(const struct btrfs_fs_info *fs_info,	\
a1d767c1SQu Wenruo		struct page *page, u64 start, u32 len)			\
a1d767c1SQu Wenruo{									\
a1d767c1SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE) {	\
a1d767c1SQu Wenruo		clear_page_func(page);					\
a1d767c1SQu Wenruo		return;							\
a1d767c1SQu Wenruo	}								\
a1d767c1SQu Wenruo	btrfs_subpage_clear_##name(fs_info, page, start, len);		\
a1d767c1SQu Wenruo}									\
a1d767c1SQu Wenruobool btrfs_page_test_##name(const struct btrfs_fs_info *fs_info,	\
a1d767c1SQu Wenruo		struct page *page, u64 start, u32 len)			\
a1d767c1SQu Wenruo{									\
a1d767c1SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE)	\
a1d767c1SQu Wenruo		return test_page_func(page);				\
a1d767c1SQu Wenruo	return btrfs_subpage_test_##name(fs_info, page, start, len);	\
60e2d255SQu Wenruo}									\
60e2d255SQu Wenruovoid btrfs_page_clamp_set_##name(const struct btrfs_fs_info *fs_info,	\
60e2d255SQu Wenruo		struct page *page, u64 start, u32 len)			\
60e2d255SQu Wenruo{									\
60e2d255SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE) {	\
60e2d255SQu Wenruo		set_page_func(page);					\
60e2d255SQu Wenruo		return;							\
60e2d255SQu Wenruo	}								\
60e2d255SQu Wenruo	btrfs_subpage_clamp_range(page, &start, &len);			\
60e2d255SQu Wenruo	btrfs_subpage_set_##name(fs_info, page, start, len);		\
60e2d255SQu Wenruo}									\
60e2d255SQu Wenruovoid btrfs_page_clamp_clear_##name(const struct btrfs_fs_info *fs_info, \
60e2d255SQu Wenruo		struct page *page, u64 start, u32 len)			\
60e2d255SQu Wenruo{									\
60e2d255SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE) {	\
60e2d255SQu Wenruo		clear_page_func(page);					\
60e2d255SQu Wenruo		return;							\
60e2d255SQu Wenruo	}								\
60e2d255SQu Wenruo	btrfs_subpage_clamp_range(page, &start, &len);			\
60e2d255SQu Wenruo	btrfs_subpage_clear_##name(fs_info, page, start, len);		\
60e2d255SQu Wenruo}									\
60e2d255SQu Wenruobool btrfs_page_clamp_test_##name(const struct btrfs_fs_info *fs_info,	\
60e2d255SQu Wenruo		struct page *page, u64 start, u32 len)			\
60e2d255SQu Wenruo{									\
60e2d255SQu Wenruo	if (unlikely(!fs_info) || fs_info->sectorsize == PAGE_SIZE)	\
60e2d255SQu Wenruo		return test_page_func(page);				\
60e2d255SQu Wenruo	btrfs_subpage_clamp_range(page, &start, &len);			\
60e2d255SQu Wenruo	return btrfs_subpage_test_##name(fs_info, page, start, len);	\
a1d767c1SQu Wenruo}
a1d767c1SQu WenruoIMPLEMENT_BTRFS_PAGE_OPS(uptodate, SetPageUptodate, ClearPageUptodate,
a1d767c1SQu Wenruo			 PageUptodate);
03a816b3SQu WenruoIMPLEMENT_BTRFS_PAGE_OPS(error, SetPageError, ClearPageError, PageError);
d8a5713eSQu WenruoIMPLEMENT_BTRFS_PAGE_OPS(dirty, set_page_dirty, clear_page_dirty_for_io,
d8a5713eSQu Wenruo			 PageDirty);
3470da3bSQu WenruoIMPLEMENT_BTRFS_PAGE_OPS(writeback, set_page_writeback, end_page_writeback,
3470da3bSQu Wenruo			 PageWriteback);
6f17400bSQu WenruoIMPLEMENT_BTRFS_PAGE_OPS(ordered, SetPageOrdered, ClearPageOrdered,
6f17400bSQu Wenruo			 PageOrdered);
cc1d0d93SQu Wenruo
cc1d0d93SQu Wenruo/*
cc1d0d93SQu Wenruo * Make sure not only the page dirty bit is cleared, but also subpage dirty bit
cc1d0d93SQu Wenruo * is cleared.
cc1d0d93SQu Wenruo */
cc1d0d93SQu Wenruovoid btrfs_page_assert_not_dirty(const struct btrfs_fs_info *fs_info,
cc1d0d93SQu Wenruo				 struct page *page)
cc1d0d93SQu Wenruo{
cc1d0d93SQu Wenruo	struct btrfs_subpage *subpage = (struct btrfs_subpage *)page->private;
cc1d0d93SQu Wenruo
cc1d0d93SQu Wenruo	if (!IS_ENABLED(CONFIG_BTRFS_ASSERT))
cc1d0d93SQu Wenruo		return;
cc1d0d93SQu Wenruo
cc1d0d93SQu Wenruo	ASSERT(!PageDirty(page));
cc1d0d93SQu Wenruo	if (fs_info->sectorsize == PAGE_SIZE)
cc1d0d93SQu Wenruo		return;
cc1d0d93SQu Wenruo
cc1d0d93SQu Wenruo	ASSERT(PagePrivate(page) && page->private);
cc1d0d93SQu Wenruo	ASSERT(subpage->dirty_bitmap == 0);
cc1d0d93SQu Wenruo}